Имя: Пароль:
1C
1С v8
Как вытащить нужную нам информацию из НТМL текста?
0 fdad
 
02.09.11
01:56
Есть некий текст который мы получили из HTML страницы
приведу фрагмент:
.......
<td>
 <a href="solution.jsp?SolutionID=253817">Автоматизация бухгалтерского и налогового учета на базе ПП &quot;1С:Бухгалтерия 8&quot; в компании &quot;АВИА-ФЭД-СЕРВИС&quot;</a>
</td>
<td>
 <a href="/rus/partners/solutions/solutions.jsp?PartID=159">1С:Бухучет и Торговля (БИТ)</a>
</td>

<td nowrap>
 <a href="?PartID=159&v8only=1&cmk=1&isGroup=1&type=26">Торговля</a>
</td>

<td nowrap>
 Август 2011
</td>
</tr>
<a name='breaks1'></a>
<tr>
<td>
 <a href="./?geo_id=175489">Москва</a>
</td>

<td>
 <a href="solution.jsp?SolutionID=299779">Внедрение ПП &quot;1С:Бухгалтерия 8&quot; для автоматизации бухгалтерского учета в &quot;ИСПОЛИН&quot;</a>
</td>

.........

Как вытащить нужный нам текст в 2 колонки и вывести на печатную форму?
пример:
1стр|Автоматизация бухгалтерского и налогового учета на базе ПП "1С:Бухгалтерия 8"|"АВИА-ФЭД-СЕРВИС"|
2стр|Внедрение ПП "1С:Бухгалтерия 8" для автоматизации бухгалтерского учета|"ИСПОЛИН"|
1 fdad
 
02.09.11
02:00
КОД:

Процедура ОсновныеДействияФормыНТТРСоединение(Кнопка)
   
  Соединение = Новый HTTPСоединение("1c.ru");
  Соединение.Прокси.Установить("http","192.168.1.250",3128);
  ВремФайл = КаталогВременныхФайлов() + Формат(ТекущаяДата(),"ДФ=ггггММддЧЧммсс")+".html";
   Соединение.Получить("/rus/partners/solutions/solutions.jsp?PartID=159&v8only=1&cmk=1&isGroup=1",ВремФайл);
  КопироватьФайл(ВремФайл, ВремФайл+".txt");
  Текст = Новый ИзвлечениеТекста(ВремФайл+".txt");
  Сообщить(Текст.ПолучитьТекст());      

КонецПроцедуры
2 Aleksey
 
02.09.11
02:18
"Тип файла определяется по расширению файла (т.е. текст из файла с расширением .tmp извлечен не будет). "

Попробуй не текст а в штмл сохранить
3 Aleksey
 
02.09.11
02:20
ну и смотри примечание к методу

Для извлечения текста из файлов используется интерфейс IFilter

Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer (http://www.citeknet.com).
4 detec
 
02.09.11
06:12
(0)

ДЛя простых случаев - регулярные выражения, для более сложных - регулярные выражения плюс обход документа DOM. Или COM-объектом HTMLFile.
5 Маленький Вопросик
 
02.09.11
06:13
регулярные выражения)
6 skunk
 
02.09.11
06:15
7 smaharbA
 
02.09.11
07:08
(1) а прокси та нафига оставил тот же ?
8 fdad
 
02.09.11
09:07
(7)а какой должен был поставить?
9 smaharbA
 
02.09.11
09:18
(8) какой в вашей сети либо не вообще убрать строчку если прокси нет