東北大学
データ駆動科学・AI教育研究センター 教授
栗林 稔 博士(工学)
TEL: 022-795-3376

English

フェイクコンテンツの識別

ある人物の複数の動画コンテンツを学習用の教師データとして深層学習技術を用いれば,虚偽の発言をリアルに再現したフェイクコンテンツが作成可能です.この技術を悪用してフェイクコンテンツを作成してインターネットを介して発信した場合,多大なる影響が及ぼされる可能性が指摘されています.この問題に対応すべく,「人工的に創造されたコンテンツ」と「正常に撮影されたコンテンツ」を判定する技術が必要であります.本研究では,対象のコンテンツが人工的な処理により創造されたものであるか否かを識別するためのシステムを実現を目指しています.

敵対的事例の検出

畳み込みニューラルネットワーク(CNN)を用いた画像認識においては,顔認証,自動運転など多くの研究分野で応用されています.しかし,意図的にノイズを加えることでCNN画像認識システムに誤検知させることが可能である問題があります.この問題は敵対的事例と呼ばれ,機械学習による分類器においては,避けることのできない特性とも言えます.本研究では,画像認識システムに入力される画像が,正常な画像であるか,意図的なノイズを加えられた敵対的事例であるかを前処理により識別させることで機械学習システムの健全性を守ることを目指しています.

深層学習モデルの知的著作権の保護

ニューラルネットワークを用いた深層学習の研究を効率的に発展させるためには,ビッグデータを用いて学習させたDNNモデルの共有が重要です.このような学習済みモデルを作成するには多大な処理能力,膨大な数のデータが必要になります.作成された学習済みモデルの重みには大きな価値があり,苦労して学習させたモデルを安易にコピーされないように,不正利用を防ぐ必要が生じています.本研究では,DNNモデルの学習時に電子透かしを埋め込むことでこの問題への対策を施します.画像,映像,音響信号などのマルチメディアコンテンツとは異なり,透かし情報の埋め込みによるDNNモデルの性能低下を抑えつつ,簡単には取り除くことのできない手法の実現を目指しています.

PDFファイルへのデータハイディング

電子透かし技術では主に,静止画や動画像,音楽などのデジタルコンテンツを扱っていました.一方,オフィス文書などのデジタルライブラリや情報配信サービスでは,流出するコンテンツの大部分は電子文書であります.本研究では,デファクトスタンダードとして広く使われているPDFファイルに着目し,そのファイル構造をうまく活用して電子透かし技術を適用することを対象にしています.

機密性の高いオフィス文書の管理

文書ファイルの電子化に伴って,不正な処理に対する対策が急務となっています.情報漏洩対策や情報の改ざん対策などは以前から重要視されており,暗号技術の適用が主な手段として運用されています.しかし,内部犯行により生じる漏洩事件においては,たとえ高度な暗号処理がなされていたとしても,復号鍵を持った犯人には何の威力も発揮しません.本研究では,正規にアクセスを許可されたユーザにおいて,極秘情報を閲覧した際に,その履歴がファイル内に自動的に保存されるようなシステムの実現を目指しています.

デザイン化された二次元コードとそのアプリ開発

標準の二次元コードは,白黒のモジュールだけで構成されており,その外見はランダムな模様となっています.一方,誤り訂正能力やモジュールの形状を変更させることで,二次元コード上にロゴマークなどの画像を表示させることが可能です.本研究では,誤り訂正符号の符号化関数をうまく修正して,表示する画像の品質を保ちつつ,通常のアプリで読み取り可能な二次元コードの作成アプリを開発しています.画質をあまり劣化させずに,画像中に二次元コードを忍ばせるために,視覚的に重要な箇所をうまく避けつつ,通常のコードの構造を変更させない符号化法を考案しています.

電子指紋技術

不正コピーの対策として,コンテンツを複数のユーザに配布する際に,コンテンツごとに異なる識別情報を電子透かし技術を用いて埋め込む方法が電子指紋技術です.もし不正コピーが発見された場合に,この識別情報が正しく抽出されれば不正コピーをしたユーザを一意に識別することができます.一方,複数のユーザがコンテンツを比較して違いを解析すると,正しく不正者を特定できなくなる恐れがあります.このような攻撃は結託攻撃と呼ばれており,その対策として結託耐性符号が考案されています.符号長が理論上最短オーダとなる符号の構成法が発表されて以来,不正者を特定するための復号法に注目が集まっており,理論上の最適な復号法も考案されています.本研究では,その最適な復号法に極めて近い特性を得られるように不正コピーから抽出した信号から結託攻撃のパラメータ推定を信号処理技術と機械学習技術をうまく活用して実現することを目指しています.