Форум → Программирование → PHP для идиотов → Парсинг ссылок
Парсинг ссылок
Страницы: ← Предыдущая страница →
-
19 ноября 2009 г. 11:13, спустя 1 час 16 минут 56 секунд
adw0rd, я просто понял, что человеку лень даже почитать что это за функции такие, потому регулярки, наверняка. для него ещё очень рано :)
Пусть сначала поймет как работать с массивами и что это такое. -
19 ноября 2009 г. 11:46, спустя 32 минуты 17 секунд
Givi, думаю ты прав, но я просто отвечал на поставленные вопросы, он просил по шаблону, я ему дал по шаблону )https://smappi.org/ - платформа по созданию API на все случаи жизни -
19 ноября 2009 г. 13:52, спустя 2 часа 6 минут 18 секунд
я вчера по пьяне прочел название темы как "пирсинг сисек" -
19 ноября 2009 г. 14:59, спустя 1 час 6 минут 31 секунду
CTAPbIu_MABP, а что пил, где брал? Там ещё хоть немного есть? =) -
19 ноября 2009 г. 15:00, спустя 1 минуту 43 секунды
http://www.pythonware.com/products/pil/ тут можно брать )
CTAPbIu_MABP, а что пил, где брал?Спустя 16 сек.зы. акция пайтон в массы продолжается!https://smappi.org/ - платформа по созданию API на все случаи жизни -
-
19 ноября 2009 г. 16:47, спустя 1 час 30 минут 54 секунды
NRG, я всего навсего бедный студент :[
Я не в тему, но все же. Если вы студент, то нужно учиться самому. -
19 ноября 2009 г. 19:38, спустя 2 часа 50 минут 48 секунд
krasun, к сожалению не во всех справочниках написано то, что мне нужно. например, я почти разобрался с вопросом(удаление элемента массива по шаблону), но столкнулся с проблемой. с помощью функции ereg_replace я меняю адрес сайта, который мне ненужен в массиве, на пустое место. в итоге вместо ненужных урлов выводятся пустые строки. например:realitory.com
reens.com
ralfstrathmann.com
и т.д. как это устранить?
P.S. вот мой код<?php
$url = "http://www.dmoz.org/Business/Arts_and_Entertainment/Media_Production/Resumes_and_Portfolios/";
$body = file_get_contents($url);
preg_match_all('/href\s*=\s*("|\')?(http:\/\/[^"\']*)("|\')?/is', $body, $out, PREG_SET_ORDER);
//print_r($out);
foreach ($out as $o) {
$a = array("http://", "/", "www.");
$b = array("", "", "");
$o[2] = str_replace($a, $b, $o[2]);
$o[2] = ereg_replace("blog.dmoz.org", "", $o[2]);
echo ($o[2]);
print '<br/>';
}
?> -
19 ноября 2009 г. 22:41, спустя 3 часа 3 минуты 24 секунды
SeRebro, ты ебанько
нахуя внутри цыкла определять переменные $a и $b?!
на$url = "http://www.dmoz.org/Business/Arts_and_Entertainment/Media_Production/Resumes_and_Portfolios/";
$body = file_get_contents($url);
preg_match_all('#(?:href\s*=\s*["|\'](?:http://)?(?:www.)?)([^\'"]*)?(?:["|\'])#six', $body, $out, PREG_SET_ORDER);
foreach ($out as $k => $v) {
if (strpos ($v[1],"blog.dmoz.org") !== false)
unset($out[$k]);
else
echo ($v[1]."<br/>");
}[/php] -
19 ноября 2009 г. 23:08, спустя 27 минут 33 секунды
CTAPbIu_MABP, спасибо. а если несколько урлов нужно убрать? -
-
-
Страницы: ← Предыдущая страница →
Пожалуйста, авторизуйтесь, чтобы написать комментарий!