Как я могу захватить элемент, сопоставляя текст в его атрибуте в BeautifulSoup

У меня есть этот код


Я хочу захватить элемент a и получить href.

how can I match the title attribute with Next Page

Я хочу частично совместить текст в атрибуте title элемента a .

There are many a tags on the page similar to it but only difference is that the title attribute contains "Next Page or the text is >.

1
добавлено отредактировано
Просмотры: 1

2 ответы

Вам нужно будет использовать Regex для выполнения того, что вы хотите.

Сначала возьмите всю разметку в виде строки и создайте с ней BeautifulSoup .

Затем используйте метод .findAll объекта BeautifulSoup следующим образом

import BeautifulSoup
import re

soup = BeautifulSoup('<html> your markup </html>')

elements = soup.findAll('a', {'title':re.compile('Next Page.'}) 
# get all 'a' elements with 'title' attribute as 'Next Page something' into a list

for e in elements:
    if str(e.string) == '>': # check if string inside 'a' tag is '>'
        print e['href']
2
добавлено
Надеюсь, что вы знаете, что «Следующая страница». означает в Regex, если не могу уточнить.
добавлено автор Aditya Sriram, источник

Вам нужно будет использовать Regex для выполнения того, что вы хотите.

Сначала возьмите всю разметку в виде строки и создайте с ней BeautifulSoup .

Затем используйте метод .findAll объекта BeautifulSoup следующим образом

import BeautifulSoup
import re

soup = BeautifulSoup('<html> your markup </html>')

elements = soup.findAll('a', {'title':re.compile('Next Page.'}) 
# get all 'a' elements with 'title' attribute as 'Next Page something' into a list

for e in elements:
    if str(e.string) == '>': # check if string inside 'a' tag is '>'
        print e['href']
2
добавлено
Надеюсь, что вы знаете, что «Следующая страница». означает в Regex, если не могу уточнить.
добавлено автор Aditya Sriram, источник