Как извлечь слова из древовидной структуры с помощью шаблона Regex

Мне нужно извлечь существительные фразы из древовидной структуры, но я не могу извлечь существительные из древовидной структуры, используя шаблон регулярного выражения.

Вот древовидная структура

(TOP (ADJP (JJ приветствуется) (PP (TO to) (NP (NNP Regular) (выражение NNP) (узнавание NNS)))))

Мне нужно извлечь все слова, которые представляют собой теги, такие как NP, NNP, NNS и т. Д .; Мне нужно получить такие слова, как Regular, Expression, learnings, используя шаблон регулярного выражения.

Может кто-нибудь, пожалуйста, помогите мне, как это получить.

1
nl ja de
что вы выберете для NP ?
добавлено автор Michael, источник
Не работает для регулярного выражения (по крайней мере Java regex не может это подтвердить). Вы можете пройти через строку и построить дерево.
добавлено автор nhahtdh, источник
Я бы рекомендовал разобрать его на фактическую структуру дерева в памяти, а затем найти то, что вы хотите.
добавлено автор Nikita Beloglazov, источник
Вы что-нибудь пробовали?
добавлено автор Nikita Beloglazov, источник
Будет ли регулярное выражение помогать мне в получении слов, которые мне нужны, или мне нужно переключиться на какую-то другую вещь?
добавлено автор user2024234, источник

1 ответы

Не уверен, что это то, что вы хотели, но это поможет вам извлечь эти слова:

Pattern regexpPattern = Pattern.compile("([A-Z]?[a-z]+)\\)");
Matcher m = regexpPattern.matcher("your string");
while (m.find()) {
    System.out.println(m.group(1));
}
1
добавлено
pro.jvm
pro.jvm
3 503 участник(ов)

Сообщество разработчиков Java Scala Kotlin Groovy Clojure Чат для нач-их: @javastart Наш сайт: projvm.com projvm.ru Наш канал: @proJVM Вакансии: @jvmjobs Конфы: @jvmconf

Java & Co
Java & Co
2 370 участник(ов)

Можно обсуждать с матом и без всё, что касается жабы, вплоть до холиваров. НЕ ИМЕЕТ ОТНОШЕНИЯ К САЙТУ JAVARUSH.RU ПРАВИЛА - https://t.me/javarush/75723 Вакансии сюда - https://telegram.me/joinchat/B7IzvUCnfo6d8t3yIxKguQ По вопросам - @thedude

learn.java
learn.java
1 888 участник(ов)

Чат для начинающих и не только Статистика: https://combot.org/chat/-1001083535868 Основной чат - @jvmchat

Java Underground
Java Underground
169 участник(ов)

https://vk.com/javatutorial

Javanese Questions
Javanese Questions
109 участник(ов)

Чат предназначен для обмена знаниями строго в формате в вопрос-ответ. Тема — Java, Kotlin и Android. Вопрос должен быть предварительно прогуглен, понятно и грамотно сформулирован, помечен хэштегами. Ответ — тем более. Куски кода размером в несколько строк можно писать прямо здесь, для больших кусков кода стоит использовать http://gist.github.com/, http://pastebin.com/, https://codeshare.io/ или любой аналогичный сервис. В некоторых случаях можно прикреплять скриншоты. Стикеры и гифки запрещены. Дополнять и уточнять вопросы и ответы — редактированием исходного сообщения. Обсуждения должны приводить к редактированию вопроса/ответа и удаляться. По хештегам можно искать существующие вопросы и овтеты: #вопрос #ответ #git #generics #java #server #awt #javafx #swing #kotlin #anko #tornadofx #ktor #android #recyclerView #performance #arch #network #permissions #storage #async