2026年06月28日(日)

　FineNews Today

ネット上の「もぐらたたき」に強い味方～KDDI研究所、『有害クローラ』を開発

TOP
>
ネット上の「もぐらたたき」に強い味方～KDDI研究所、『有害クローラ』を開発

新着ニュース30件

冷涼刺激で、スカッと爽快！シトラス風味の瞬間刺激が特徴の“瞬間スッキリ飲料”「イラリセット」、6月22日（月）より新発売

元パティシエのスタッフが手がける、“見て楽しい・食べておいしい”新スイーツ『ランドセルサブレ』、池田屋実店舗限定で好評販売中

【宝酒造】タカラ「辛口ゼロボール」〈夏のライムミント〉、 6月23日(火)季節限定新発売！

【“もう一度飲みたい”の声に応えて復活】山本義徳氏も愛する一杯、「VALX ホエイプロテインメロン風味」が、数量限定で再登場！

韓国発「カムジャパン」風、え、じゃがいも？「じゃがいもまん（カムジャパン風）」

FOSSIL、5月4日「スター・ウォーズの日」に、『マンダロリアン』限定コレクションを発表

【GOKUMIN】"エアコン寒い vs 消すと暑い"——夏の睡眠ジレンマに、1枚で応える2WAYリバーシブル冷感ケット「ヒヤトロンケット」、4月30日新発売

サンクトガーレン、みずみずしいスイカの甘さが弾ける「すいかウィート」4月24日発売。直営店、GWイベントにて樽生限定

ケミカルリサイクルPP製品「NOVAORBIS™-CR（ノバオルビス™-CR）」が、キユーピーの限定販売ドレッシング製品に採用

【奄美ビール】奄美産「果汁爆弾たんかん」を丸ごと使った新ジャンルRTD2種を発売開始　~たんかん皮ごと果汁と漬け込んだ「たんかん生サワー」×たんかんピールを漬け込んだ「大人のジンソーダ」~

ジョニーウォーカーから、新商品「ジョニーウォーカーブロンド」いよいよ4月7日発売！“ミックスのために生まれた”新スタイルのウイスキーを提案、「Magic Hour Mix（マジックアワーミックス）」

塗って焼くだけで明太フランス！丸和油脂、「食卓のやまや焼き明太子使用明太マヨスプレッド」新発売

ブルボン、ザクッと食感のスティックシリアル「レザール」を、3月10日(火)に新発売！

アースコンシャス、「エプソムソルト・ナチュラル歯みがき」新発売

新入生セット29,700円！CONOMiの「安心おまかせ3点制服セット」発売

厳選茶葉の清らかな旨みと香り、「葉の茶」をリニューアルして、新発売

トレンド感ある巾着フォルム。毎日のランチタイムが楽しみになるランチバッグが登場！

「テリヤキバーガー」の味わいが、おかきで楽しめる！モスバーガー監修「ラッキーマヨネーズおかきテリヤキバーガー風味」

ツエーゲン金沢が、直営グルメショップ「ツエーゲンキッチン」をOPEN！試合観戦に、新たな楽しみ創出。

ブルボン、エチゴビールの限定醸造クラフトビール “笑顔が集う輝きビール”を、2月6日(金)に新発売！

おつまみにぴったり！ザクザクッ食感『しゃり蔵ザクザクッ韓国のり風味』新発売！

電子レンジで具だくさんスープ！『楽チン屋Ⓡ』シリーズ第二弾「レンジで作る参鶏湯の素」「レンジで作る和だしスープカレーの素」を発売

【2026年】塗るだけでシールが作れる！MYmamaオリジナル粘着剤『しーるん』新発売

【今シーズン最強の寒波襲来】数年に一度の寒波から、愛車を守る！布製タイヤチェーン「MTKカーソックス2」が、年末年始限定クーポンを配布中！

【9,900円ゲット】新製品タブレット『Teclast P85』を期間限定の低価格でお得に購入可能！ Amazonセール開催(12/17から12/26まで)

Antigravity A1、新製品発表会を開催—世界初、8K360度全景ドローンによる未来の飛行へ

スマホ・AirPods・パソコンを充電しながら、映像出力やUSB機器の拡張もできる！Qi2対応4in1ドッキングステーションを新発売

仮想通貨詐欺の被害者を救う新サービス ― 合同会社リサーチ（仮想通貨詐欺返金支援センター）が、ブロックチェーン解析で返金支援を強化

こども食堂じゃない？【新しい仕組みのこども食堂】が、食事累計提供数10,000食を突破！全国に拡がる『ドコデモこども食堂』

ネット上の「もぐらたたき」に強い味方～KDDI研究所、『有害クローラ』を開発

　2011年2月8日 16:00　

株式会社KDDI研究所は、有害情報を含むWebページ（有害ページ）をインターネット上から効率的に自動収集する『有害クローラ』を開発したことを発表した。

有害情報フィルタを生成する場合には、「有害」と判定するための有害ページをできるだけ多く収集する必要があるが、膨大なWebページが日々生成されるインターネット上においては、効率的な収集技術が必要となっていることから、今回の開発に至った経緯がある。

今回のプログラムでは、従来のWebクローラに対して、URLから得られるWebページの様々な特性を抽出し、Webページ自体を収集する前に有害ページである可能性を推定する機能が追加されている。

この機能により、Webページを発見した順に収集する従来のWebクローラよりも、収集したWebページ中に有害ページをより多く含めることができ、Webページの検査効率を飛躍的に高めることができる。

なお、収集効率を測る実験では、従来のWebクローラに比べて、約3.5倍の有害ページ収集率向上が確認できたとのこと。

複数の文書（ファイル）から特定の文字列を検索する方式を「全文検索方式」といい、全文検索に用いられるデータベースを作成することが一般的となっている。

Webクローラとは、そのデータベースを作成するために、世界中のさまざまなWebページを回収するプログラムのことで、まだ収録されていないWebページや、更新されたWebページ内容をデータベースに反映させる処理を行っている。

ちなみに、有害情報とは、主に青少年がその情報に接することによって健全な発達・育成を阻害する恐れが有ると考えられているコンテンツの総称。以前は、雑誌等の「有害図書」やテレビの「有害番組」が、それにあたっていたが、情報を伝えるチャネルの増加により、インターネット上のWebページも含まれるようになっている。

ばっさりと押し寄せる雑多な情報を遮断できるなら、それに越したことはないのだろうが、インターネットの本来の目的とは、かい離することになる。こういったものだと理解して、つきあうべきなのかもしれない。