The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"HTML parsing"
Вариант для распечатки Архивированная нить - только для чтения! 
Пред. тема | След. тема 
Форумы WEB технологии (Public)
Изначальное сообщение [Проследить за развитием треда]

"HTML parsing"
Сообщение от Александр emailИскать по авторуВ закладки on 29-Фев-04, 14:24  (MSK)
И снова здравствуйте.
Скажите, пожалуйста, есть ли какие методы для парсинга HTML страниц?
Интересует не только и не столько преобразование HTML в дерево вида:
[<html>] => [<head>] => [<title> = 'Some title'] и т.д.
сколько парсинг для получения содержимого страницы. То есть, например, я хочу получать курс валют с rbc.ru, или грабить заголовки свежих постингов с какого-то сайта (который не предоставляет никакого RSS).
Есть ли такие решения? Если да, то ткните, пожалуйста, носом в доки (алгоритм) и/или подобные программы/скрипты (предпочтительно на C или PHP, но не принципиально).

Заранее благодарен.

  Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "HTML parsing"
Сообщение от MeLLowD Искать по авторуВ закладки on 01-Мрт-04, 14:30  (MSK)
Вот пример парсинга курсов USD и EUR с cbr.ru, для других валют достаточно добавить соответствующие коды в switch.
А вообще, копайте в сторону регулярных выражений.

function get_currency ($c = "USD") {

   switch ($c) {

     case "USD":
       $code = 840;
     break;

     case "EUR":
       $code = 978;
     break;

  }

  $html = file ('http://cbr.ru/currency_base/daily.asp?date_req='.date("d/m/Y"));

  foreach ($html as $key => $val) {
    if (strip_tags($val) == $code) {
      $res = strip_tags($html[$key+6]);
      $res = preg_replace ("/,/",".",$res);
    };
  };

  return $res;

}


  Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "HTML parsing"
Сообщение от Александр emailИскать по авторуВ закладки on 01-Мрт-04, 14:54  (MSK)
>Вот пример парсинга курсов USD и EUR с cbr.ru, для других валют
>достаточно добавить соответствующие коды в switch.
>А вообще, копайте в сторону регулярных выражений.

Красивое решение.
В сторону регулярных выражений - понятно; может кто знает готовые решения?

  Рекомендовать в FAQ | Cообщить модератору | Наверх

3. "HTML parsing"
Сообщение от MeLLowD Искать по авторуВ закладки on 01-Мрт-04, 15:55  (MSK)
>Красивое решение.
>В сторону регулярных выражений - понятно; может кто знает готовые решения?

http://anton.concord.ru/htmlparser/htmlparser-1.3.zip
http://anton.concord.ru/

  Рекомендовать в FAQ | Cообщить модератору | Наверх

4. "HTML parsing"
Сообщение от Александр emailИскать по авторуВ закладки on 01-Мрт-04, 18:00  (MSK)
>>Красивое решение.
>>В сторону регулярных выражений - понятно; может кто знает готовые решения?
>
>http://anton.concord.ru/htmlparser/htmlparser-1.3.zip
>http://anton.concord.ru/

Это именно парсер, а если ещё и информацию вытягивать нужно?

  Рекомендовать в FAQ | Cообщить модератору | Наверх

5. "HTML parsing"
Сообщение от MeLLowD Искать по авторуВ закладки on 01-Мрт-04, 19:08  (MSK)
>>>Красивое решение.
>>>В сторону регулярных выражений - понятно; может кто знает готовые решения?
>>
>>http://anton.concord.ru/htmlparser/htmlparser-1.3.zip
>>http://anton.concord.ru/
>
>Это именно парсер, а если ещё и информацию вытягивать нужно?

думаю тогда вам сюда http://phpclub.ru/?m=app&s=4
или в поиск по ключу "Web Fetching"

  Рекомендовать в FAQ | Cообщить модератору | Наверх

6. "HTML parsing"
Сообщение от Александр emailИскать по авторуВ закладки on 01-Мрт-04, 20:14  (MSK)
>>>>Красивое решение.
>>>>В сторону регулярных выражений - понятно; может кто знает готовые решения?
>>>
>>>http://anton.concord.ru/htmlparser/htmlparser-1.3.zip
>>>http://anton.concord.ru/
>>
>>Это именно парсер, а если ещё и информацию вытягивать нужно?
>
>думаю тогда вам сюда http://phpclub.ru/?m=app&s=4
>или в поиск по ключу "Web Fetching"

Thanks.

  Рекомендовать в FAQ | Cообщить модератору | Наверх


Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру