URL извлечения от Google

Я хотел бы извлечь связи, когда вы заставляете Google искать с определенным ключевым словом. Я знаю, что API уже существует, но я хочу создать свой собственный сценарий. В настоящее время я могу извлечь связи, но мой regex не очень хорош.

#  /url?q=http://wikipedia.org/wiki/World_Wide_Web&sa=U&ei=naEHUbDoLITQ0QXWwIGoCw&ved=0CB8QFjAA&usg=AFQjCNEn84GVN2VHpfEVjnMm5FG_p8YjgQ

Я не знаю точно, как мы можем держать только реальный URL. Так, если у вас есть идея. Спасибо

$key = "test"; 
if ($kw = $key){
    $pagenum = 0;               
    $googlefrurl = "http://www.google.com/search?q=" . urlencode($kw) . "&start=$pagenum";

    while($pagenum <= 0){
        $result= file_get_contents($googlefrurl); 
        preg_match_all('si', $result, $matches);
        $i = 0;         
        $n = count($matches[1]);        
        $pagenum++;         
        $pagenum2 = $pagenum.'0'; 
        $googlefrurl = "http://www.google.com/search?q=" . urlencode($kw) .
            "&start=$pagenum2&safe=off&pwst=1&filter=0";

        while($i <= $n){
            $u++;
        } 
    }
}
1
nl ja de
Почему очищают место (который является против Google' s Положения и условия), когда API доступен?
добавлено автор Pekka 웃, источник

1 ответы

You need a Google API Key to make searchs and then use the custom search REST API https://developers.google.com/custom-search/v1/using_rest

Которые возвращают JSON с результатами и всем, в чем вы нуждаетесь Например, запрос (быстрая копия от докторов):

GET https://www.googleapis.com/customsearch/v1?
key=INSERT-YOUR-KEY&cx=013036536707430787589:_pqjad5hr1a&q=flowers&alt=json

Прибыль

200 OK

{
 "kind": "customsearch#search",
 "url": {
  "type": "application/json",
  "template": "https://www.googleapis.com/customsearch/v1?q={searchTerms}&num={count?}&start={startIndex?}&lr={language?}&safe={safe?}&cx={cx?}&cref={cref?}&sort={sort?}&filter={filter?}&gl={gl?}&cr={cr?}&googlehost={googleHost?}&c2coff={disableCnTwTranslation?}&hq={hq?}&hl={hl?}&nsc={nsc?}&siteSearch={siteSearch?}&siteSearchFilter={siteSearchFilter?}&exactTerms={exactTerms?}&excludeTerms={excludeTerms?}&linkSite={linkSite?}&orTerms={orTerms?}&relatedSite={relatedSite?}&dateRestrict={dateRestrict?}&lowRange={lowRange?}&highRange={highRange?}&searchType={searchType}&fileType={fileType?}&rights={rights?}&imgSize={imgSize?}&imgType={imgType?}&imgColorType={imgColorType?}&imgDominantColor={imgDominantColor?}&alt=json"
 },
 "queries": {
  "nextPage": [
   {
    "title": "Google Custom Search - flowers",
    "totalResults": 10300000,
    "searchTerms": "flowers",
    "count": 10,
    "startIndex": 11,
    "inputEncoding": "utf8",
    "outputEncoding": "utf8",
    "cx": "013036536707430787589:_pqjad5hr1a"
   }
  ],
  "request": [
   {
    "title": "Google Custom Search - flowers",
    "totalResults": 10300000,
    "searchTerms": "flowers",
    "count": 10,
    "startIndex": 1,
    "inputEncoding": "utf8",
    "outputEncoding": "utf8",
    "cx": "013036536707430787589:_pqjad5hr1a"
   }
  ]
 },
 "context": {
  "title": "Custom Search"
 },
 "items": [
 {
   "kind": "customsearch#result",
   "title": "Flower - Wikipedia, the free encyclopedia",
   "htmlTitle": "\u003cb\u003eFlower\u003c/b\u003e - Wikipedia, the free
   encyclopedia",
   "link": "http://en.wikipedia.org/wiki/Flower",
   "displayLink": "en.wikipedia.org",
   "snippet": "A flower, sometimes known as a bloom or blossom, is the reproductive structure found in flowering plants (plants of the division Magnoliophyta, ...",
   "htmlSnippet": "A \u003cb\u003eflower\u003c/b\u003e, sometimes known as a bloom or blossom, is the reproductive structure \u003cbr\u003e  found in flowering plants (plants of the division Magnoliophyta, \u003cb\u003e... \u003c/b\u003e",
   "pagemap": {
    "RTO": [
     {
      "format": "image",
      "group_impression_tag": "prbx_kr_rto_term_enc",
      "Opt::max_rank_top": "0",
      "Opt::threshold_override": "3",
      "Opt::disallow_same_domain": "1",
      "Output::title": "\u003cb\u003eFlower\u003c/b\u003e",
      "Output::want_title_on_right": "true",
      "Output::num_lines1": "3",
      "Output::text1": "꽃은 식물 에서 씨 를 만들어 번식 기능을 수행하는 생식 기관 을 말한다. 꽃을 형태학적으로 관찰하여 최초로 총괄한 사람은 식물계를 24강으로 분류한 린네 였다. 그 후 꽃은 식물분류학상중요한 기준이 되었다.",
      "Output::gray1b": "- 위키백과",
      "Output::no_clip1b": "true",
      "UrlOutput::url2": "http://en.wikipedia.org/wiki/Flower",
      "Output::link2": "위키백과 (영문)",
      "Output::text2b": "   ",
      "UrlOutput::url2c": "http://ko.wikipedia.org/wiki/꽃",
      "Output::link2c": "위키백과",
      "result_group_header": "백과사전",
      "Output::image_url": "http://www.gstatic.com/richsnippets/b/fcb6ee50e488743f.jpg",
      "image_size": "80x80",
      "Output::inline_image_width": "80",
      "Output::inline_image_height": "80",
      "Output::image_border": "1"
     }
    ]
   }
  },
  ...
 ]
}
0
добавлено
Спасибо, но я don' t хотят, чтобы инструменты Google сделали его, если возможно.
добавлено автор user33733, источник
SEO chat
SEO chat
5 476 участник(ов)

Чат про SEO. Speak Russian! Др.чаты: @ppcchat @uiux_chat @devschat @smmhell Работа: @seohr Канал: @seolife Аудит: tpv.sr/1QoBSBb Стата: tpv.sr/1QoBMrK/ Запрещено: - мат и брань - команды ботам - реклама, вакансии - религия, политика, наркота, крипта

phpGeeks
phpGeeks
3 620 участник(ов)

Best PHP chat Еще: @dbGeeks - базы данных @phpGeeksJunior - новичкам @moscowProgers - IT Москва @ebanoePhp - весёлый канал о PHP @laravel_pro - Laravel @jobGeeks - вакансии @jsChat - JS Правила: https://t.me/phpGeeks/764859 ДР - 28.03.2016

PHP
PHP
1 309 участник(ов)

Группа про современный PHP. Обсуждаем ООП, TDD, BDD, DDD, SOLID, GRASP и прочие крутые базворды Для ознакомления: https://gist.github.com/mkusher/711bd46f0b62fbae851182e6fb3b1839 Группа PHP для новичков @phpGeeksJunior Вакансии: https://t.me/fordev

PHP — вакансии, поиск работы и аналитика
PHP — вакансии, поиск работы и аналитика
1 251 участник(ов)

Публикуем вакансии и запросы на поиск работы по направлению PHP, Laravel, Symfony, Yii и т.д. Здесь всё: full-time, part-time, remote и разовые подработки. См. также: @qa_jobs, @devops_jobs, @javascript_jobs, @nodejs_jobs, @uiux_jobs, @products_jobs

phpGeeksJunior
phpGeeksJunior
980 участник(ов)

Группа для новичков. Не стесняйтесь задавать вопросы по php. Не флудить!!!! Правила и полезные ссылки https://gist.github.com/exileed/a53dd0617b35a705ff44b38c8028e6a5 Бест от пхпгикс https://t.me/best_of_phpgeeks

phpclub.ru
phpclub.ru
872 участник(ов)

Официальный чат phpclub.ru - остерегайтесь подделок #rules Правила группы - уважайте друг друга. Скриншоты -> ссылками. Код -> pastebin.com. Вакансии строго -> https://goo.gl/4bNxym, в чат ссылку. За рекламу и мат - БАН!

Devall | PHP
Devall | PHP
272 участник(ов)

Пристанище для восходящих звёзд разработки, которые перейдут на более адекватные языки. http://combot.org/chat/-1001014863761 Инвайт: j.mp/devallphp