ニューズラインエマージング・テクノロジーの最新情報をお届け。

AI is learning how to spot risky websites for you

URL文字列に着目、機械学習でフィッシング対策

機械学習を使えば、ユーザーがフィッシング詐欺に遭わないように怪しいURLの特徴を探知できる。

問題になっているのは、ユーザーの情報を盗んだり、マルウェアをインストールさせることだけを目的としたWebサイトがインターネット上にあふれていることだ。ウイルス対策企業はそうしたサイトをできるだけ速やかにブラックリストに載せるようにしているが、日々新しいサイトが立ち上げられる状況ではいたちごっこだ。

「URLNet」と呼ばれる新しいシステムは、ニューラル・ネットワークを使ってこの問題に対処している。お察しの通り、ニューラル・ネットワークはサイトのURLを文字レベルと単語レベルで検索し、そのリスクを検知する。URLにはサイトが有害かどうかを判断するための手掛かりが含まれている。たとえば、悪意のある長さであったり、正規のサイトに似せた少しだけスペルが違うドメイン名などだ。

研究者らはURLNetを2つのデータセットで訓練した。1つは正規サイトと有害サイトのURL合わせて100万件のデータで、もう1つは500万件のデータだ。どちらの場合でも、URLNetは怪しいサイトを検知することにおいて、現行の他のシステムより優れた結果を出した。

参照元: arxiv

jackie.snow [Jackie Snow] 2018.02.23, 9:51

MITテクノロジーレビューが選んだ、世界を変える10大技術: MITテクノロジーレビューの記者と編集者は、未来を形作るエマージング・テクノロジーについて常に議論している。年に一度、私たちは現状を確認し、その見通しを読者に共有する。以下に挙げるのは、良くも悪くも今後数年間で進歩を促し、あるいは大きな変化を引き起こすと本誌が考えるテクノロジーである。
特集ページへ

MITテクノロジーレビューは有料会員制サイトです

有料会員になると、毎月150本以上更新されるオリジナル記事が読み放題！