array( 'name'=>'Feed', 'type'=>'list', 'values'=>array( 'Les flux multi-magazines'=>array( 'Les dernières actualités de Futura-Sciences'=>'actualites', 'Les dernières définitions de Futura-Sciences'=>'definitions', 'Les dernières photos de Futura-Sciences'=>'photos', 'Les dernières questions - réponses de Futura-Sciences'=>'questions-reponses', 'Les derniers dossiers de Futura-Sciences'=>'dossiers' ), 'Les flux Services'=> array( 'Les cartes virtuelles de Futura-Sciences'=>'services/cartes-virtuelles', 'Les fonds d\'écran de Futura-Sciences'=>'services/fonds-ecran' ), 'Les flux Santé'=>array( 'Les dernières actualités de Futura-Santé'=>'sante/actualites', 'Les dernières définitions de Futura-Santé'=>'sante/definitions', 'Les dernières questions-réponses de Futura-Santé'=>'sante/question-reponses', 'Les derniers dossiers de Futura-Santé'=>'sante/dossiers' ), 'Les flux High-Tech'=>array( 'Les dernières actualités de Futura-High-Tech'=>'high-tech/actualites', 'Les dernières astuces de Futura-High-Tech'=>'high-tech/question-reponses', 'Les dernières définitions de Futura-High-Tech'=>'high-tech/definitions', 'Les derniers dossiers de Futura-High-Tech'=>'high-tech/dossiers' ), 'Les flux Espace'=>array( 'Les dernières actualités de Futura-Espace'=>'espace/actualites', 'Les dernières définitions de Futura-Espace'=>'espace/definitions', 'Les dernières questions-réponses de Futura-Espace'=>'espace/question-reponses', 'Les derniers dossiers de Futura-Espace'=>'espace/dossiers' ), 'Les flux Environnement'=>array( 'Les dernières actualités de Futura-Environnement'=>'environnement/actualites', 'Les dernières définitions de Futura-Environnement'=>'environnement/definitions', 'Les dernières questions-réponses de Futura-Environnement'=>'environnement/question-reponses', 'Les derniers dossiers de Futura-Environnement'=>'environnement/dossiers' ), 'Les flux Maison'=>array( 'Les dernières actualités de Futura-Maison'=>'maison/actualites', 'Les dernières astuces de Futura-Maison'=>'maison/question-reponses', 'Les dernières définitions de Futura-Maison'=>'maison/definitions', 'Les derniers dossiers de Futura-Maison'=>'maison/dossiers' ), 'Les flux Nature'=>array( 'Les dernières actualités de Futura-Nature'=>'nature/actualites', 'Les dernières définitions de Futura-Nature'=>'nature/definitions', 'Les dernières questions-réponses de Futura-Nature'=>'nature/question-reponses', 'Les derniers dossiers de Futura-Nature'=>'nature/dossiers' ), 'Les flux Terre'=>array( 'Les dernières actualités de Futura-Terre'=>'terre/actualites', 'Les dernières définitions de Futura-Terre'=>'terre/definitions', 'Les dernières questions-réponses de Futura-Terre'=>'terre/question-reponses', 'Les derniers dossiers de Futura-Terre'=>'terre/dossiers' ), 'Les flux Matière'=>array( 'Les dernières actualités de Futura-Matière'=>'matiere/actualites', 'Les dernières définitions de Futura-Matière'=>'matiere/definitions', 'Les dernières questions-réponses de Futura-Matière'=>'matiere/question-reponses', 'Les derniers dossiers de Futura-Matière'=>'matiere/dossiers' ), 'Les flux Mathématiques'=>array( 'Les dernières actualités de Futura-Mathématiques'=>'mathematiques/actualites', 'Les derniers dossiers de Futura-Mathématiques'=>'mathematiques/dossiers' ) ) ) )); public function collectData(){ $url = self::URI . 'rss/' . $this->getInput('feed') . '.xml'; $this->collectExpandableDatas($url, 10); } protected function parseItem($newsItem){ $item = $this->parseRSS_2_0_Item($newsItem); $item['uri'] = str_replace('#xtor=RSS-8', '', $item['uri']); if($this->get_cached_time($item['uri']) <= strtotime('-24 hours')) $this->remove_from_cache($item['uri']); $article = $this->get_cached($item['uri']) or $this->returnServerError('Could not request Futura-Sciences: ' . $item['uri']); $item['content'] = $this->ExtractArticleContent($article); $item['author'] = empty($this->ExtractAuthor($article)) ? $item['author'] : $this->ExtractAuthor($article); return $item; } function StripWithDelimiters($string, $start, $end) { while (strpos($string, $start) !== false) { $section_to_remove = substr($string, strpos($string, $start)); $section_to_remove = substr($section_to_remove, 0, strpos($section_to_remove, $end) + strlen($end)); $string = str_replace($section_to_remove, '', $string); } return $string; } function StripRecursiveHTMLSection($string, $tag_name, $tag_start) { $open_tag = '<'.$tag_name; $close_tag = ''; $close_tag_length = strlen($close_tag); if (strpos($tag_start, $open_tag) === 0) { while (strpos($string, $tag_start) !== false) { $max_recursion = 100; $section_to_remove = null; $section_start = strpos($string, $tag_start); $search_offset = $section_start; do { $max_recursion--; $section_end = strpos($string, $close_tag, $search_offset); $search_offset = $section_end + $close_tag_length; $section_to_remove = substr($string, $section_start, $section_end - $section_start + $close_tag_length); $open_tag_count = substr_count($section_to_remove, $open_tag); $close_tag_count = substr_count($section_to_remove, $close_tag); } while ($open_tag_count > $close_tag_count && $max_recursion > 0); $string = str_replace($section_to_remove, '', $string); } } return $string; } function ExtractArticleContent($article){ $contents = $article->find('div.content', 0)->innertext; foreach (array( '
StripRecursiveHTMLSection($contents , 'div', $div_start); } $contents = $this->StripWithDelimiters($contents, '
'); $contents = $this->StripWithDelimiters($contents, '

'); $contents = $this->StripWithDelimiters($contents, 'fs:definition="', '"'); $contents = $this->StripWithDelimiters($contents, 'fs:xt:clicktype="', '"'); $contents = $this->StripWithDelimiters($contents, 'fs:xt:clickname="', '"'); return $contents; } // Extracts the author from an article or element function ExtractAuthor($article){ $article_author = $article->find('span.author', 0); if($article_author){ return trim(str_replace(', Futura-Sciences', '', $article_author->plaintext)); } return ''; } }