Поскольку некоторые веб-страницы могут быть недействительными XML, вы также можете использовать регулярные выражения для извлечения данных, которые вы хотите с веб-страницы. Иногда подход XMLReader просто терпит неудачу.
Образец:
require 'open-uri'
page_content = open("http://your_page.com").read
page_body = page_content.scan(/<body>(.*)<\/body>/i).first
# do whatever you want with it
Как сказал VBSlover, capybara полезен для рассмотрения связанных вещей.
Выполнение этого автоматическим способом каждые n минут или тому подобное также возможно при каждом драгоценном камне.
Для обработки базы данных есть много очень хороших камней.
Окончательный ответ: теперь с ruby вы не можете ничего сделать. Хорошо, возможно, кроме написания действительно (!) Высокопроизводительных кодов/3D-двигателей.
Edit:
if you can tell what you exactly want to do i may suggest you some matching gems.
Usually "There is a gem for it" is a good saying. you can browse rubygems.org for some keywords you need, or look at https://www.ruby-toolbox.com/ for some categorized/ranked suggestions for your problem. :)
EDIT 2:
have a look at http://watir.com/
maybe just play around with it in some little painless scripts to get a feeling for it and if it is the solution for you.
Watir управляет браузерами так же, как люди. Он нажимает ссылки, заполняет
в формах, нажимает кнопки. Watir также проверяет результаты, например,
ожидаемый текст появляется на странице.
Как только вы его нажмете на все, просто очистите результаты (или все, что вам нужно) от веб-страницы, используя некоторый XML-Parser (nokogiri - хороший выбор) или некоторые регулярные выражения.
Затем введите данные в свою базу данных. Activeecord приходит на ум за это, но это может быть или не быть излишним. в зависимости от вашей базы данных, выберите любой подходящий вам адаптер/жемчуг (опять же: есть МНОГО).
Если вы хотите делать это каждый час или тому подобное, просто используйте каждый раз, когда драгоценный камень (управляет кроной для вас), или просто напишите бесконечный цикл со сном (x) в нем, если хотите. Существует несколько способов сделать это. :)