Лучший способ запрограммировать инструмент, который ищет комбинации подразделов регулярного выражения в текстовом файле

У меня есть большой текстовый файл, каждая строка которого является уникальной концепцией. Есть, вероятно, только небольшое количество шаблонов для каждой строки.

Если я хочу запустить текстовый файл и найти общие шаблоны между строками для использования с последующим расширением регулярного выражения каждого подраздела строки; что было бы лучшим способом или существуют ли существующие инструменты? Я предпочитаю Python.

Таким образом, строка может следовать этим шаблонам:

(1 to 5 alpha letters)(,)(space)(Sentence)
(word)(.)(space)(Sentence)(Sentence)
(word)(number)(.)(space)(Sentence)(Sentence)
(word)(!)(space)(Sentence)(Sentence)

Я мог бы не знать о (!), Например.

В основном он должен извлекать список регулярных выражений, которые в совокупности охватывают каждую возможную строку, но с определенными строительными блоками; (от 1 до 5 букв альфа) (Предложение) (все, что не покрывается строительными блоками)

1
nl ja de

1 ответы

То, что вы ищете, является алгоритмом для распознавания образов и/или data mining , которые являются очень сложными подполями искусственного интеллекта.

Я предлагаю вам либо взять книгу на эту тему, либо попытаться решить вашу проблему по-другому.

0
добавлено
Python
Python
7 654 участник(ов)

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/577926

Python beginners
Python beginners
4 449 участник(ов)

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Не злоупотребляйте стикерами. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Статистика тут: https://grstats.me/chat/x4qym2k5uvfkr3al6at7

pro.python
pro.python
1 090 участник(ов)

Сообщество разработчиков под Python Создатель: @rodgelius

Rude Python
Rude Python
971 участник(ов)

Python без „девочек”, здесь матерятся и унижают Django. Not gay friendly. Правила: t.me/rudepython/114107 @rudepython | t.me/rudepython

rupython
rupython
509 участник(ов)

Группа создана с целью оперативного получения ответов на возникающие вопросы по разработке на яп python, смежные темы, а также человеческого общения. Приветствую!

Python-programming
Python-programming
266 участник(ов)

Чат группы вконтакте https://vk.com/python_community