![]() |
![]() |
![]() |
|
Как вытащить нужную нам информацию из НТМL текста? | ☑ | ||
---|---|---|---|---|
0
fdad
02.09.11
✎
01:56
|
Есть некий текст который мы получили из HTML страницы
приведу фрагмент: ....... <td> <a href="solution.jsp?SolutionID=253817">Автоматизация бухгалтерского и налогового учета на базе ПП "1С:Бухгалтерия 8" в компании "АВИА-ФЭД-СЕРВИС"</a> </td> <td> <a href="/rus/partners/solutions/solutions.jsp?PartID=159">1С:Бухучет и Торговля (БИТ)</a> </td> <td nowrap> <a href="?PartID=159&v8only=1&cmk=1&isGroup=1&type=26">Торговля</a> </td> <td nowrap> Август 2011 </td> </tr> <a name='breaks1'></a> <tr> <td> <a href="./?geo_id=175489">Москва</a> </td> <td> <a href="solution.jsp?SolutionID=299779">Внедрение ПП "1С:Бухгалтерия 8" для автоматизации бухгалтерского учета в "ИСПОЛИН"</a> </td> ......... Как вытащить нужный нам текст в 2 колонки и вывести на печатную форму? пример: 1стр|Автоматизация бухгалтерского и налогового учета на базе ПП "1С:Бухгалтерия 8"|"АВИА-ФЭД-СЕРВИС"| 2стр|Внедрение ПП "1С:Бухгалтерия 8" для автоматизации бухгалтерского учета|"ИСПОЛИН"| |
|||
1
fdad
02.09.11
✎
02:00
|
КОД:
Процедура ОсновныеДействияФормыНТТРСоединение(Кнопка) Соединение = Новый HTTPСоединение("1c.ru"); Соединение.Прокси.Установить("http","192.168.1.250",3128); ВремФайл = КаталогВременныхФайлов() + Формат(ТекущаяДата(),"ДФ=ггггММддЧЧммсс")+".html"; Соединение.Получить("/rus/partners/solutions/solutions.jsp?PartID=159&v8only=1&cmk=1&isGroup=1",ВремФайл); КопироватьФайл(ВремФайл, ВремФайл+".txt"); Текст = Новый ИзвлечениеТекста(ВремФайл+".txt"); Сообщить(Текст.ПолучитьТекст()); КонецПроцедуры |
|||
2
Aleksey
02.09.11
✎
02:18
|
"Тип файла определяется по расширению файла (т.е. текст из файла с расширением .tmp извлечен не будет). "
Попробуй не текст а в штмл сохранить |
|||
3
Aleksey
02.09.11
✎
02:20
|
ну и смотри примечание к методу
Для извлечения текста из файлов используется интерфейс IFilter Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer (http://www.citeknet.com). |
|||
4
detec
02.09.11
✎
06:12
|
(0)
ДЛя простых случаев - регулярные выражения, для более сложных - регулярные выражения плюс обход документа DOM. Или COM-объектом HTMLFile. |
|||
5
Маленький Вопросик
02.09.11
✎
06:13
|
регулярные выражения)
|
|||
6
skunk
02.09.11
✎
06:15
|
||||
7
smaharbA
02.09.11
✎
07:08
|
(1) а прокси та нафига оставил тот же ?
|
|||
8
fdad
02.09.11
✎
09:07
|
(7)а какой должен был поставить?
|
|||
9
smaharbA
02.09.11
✎
09:18
|
(8) какой в вашей сети либо не вообще убрать строчку если прокси нет
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |