人工知能学会2020の参加レポートです。
あいさつ
こんにちは! オプトテクノロジーズ データサイエンスエンジニアのnatsuumeです。今回は2020年6月9日(火)~2020年6月12日(金)で開催された人工知能学会(JSAI)2020を聴講したので、いくつか個人的に気になったものを紹介したいと思います。
なお弊社ではシルバースポンサーとして協賛させていただいたほか、6月9日のインダストリアルセッション1にて社内事例について発表いたしました。
今年のJSAI2020は熊本での開催が予定されていましたが、新型コロナウイルスの影響で急遽Zoomを利用したオンラインでの開催となりました。人工知能学会全国大会としては初めての試みでしたが、特に支障なく聴講することができました。これもひとえにご尽力いただいた運営の方々のおかげです。この場を借りてお礼申し上げます。
発表所感
発表を聴講したものの中から、いくつか個人的に気になったものを紹介したいと思います。
画像広告のクリック予測における高次の特徴量の検討
- 著者:熊谷 雄介(株式会社博報堂), 久原 卓(株式会社博報堂), 三木 一弘(株式会社テクノプロ), 町田 尚基(株式会社アイズファクトリー), 藤原 晴雄(株式会社博報堂), 道本 龍(株式会社博報堂)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_1H3OS12a01/_article/-char/ja
バナー画像について、画像中の商品領域や商品ロゴの領域、画像中テキストの文字情報などがCTR予測に対して効果があるのかを調査した研究です。商品領域・商品ロゴ領域について矩形選択でアノテーションを行ったほか、広告中の文字列についてOCRによるものと人手で書き起こしたものを用意し、CTRの予測を行っています。
結論としては商品領域や商品ロゴ領域のアノテーション情報はCTRの予測に対して有用であること、文字列書き起こしについても同様にCTR予測時に有用であること、OCRによる文字列アノテーションよりも人手による書き起こしのほうが結果は良かったが改善幅を考えるとコストに見合うかは検討の余地があることなどが述べられていました。
複数の入力を用いたキャッチコピーの評価
- 著者:石川 隆一(株式会社 電通デジタル), 林 秀和(株式会社 電通デジタル)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_1H3OS12a03/_article/-char/ja
プロのコピーライターが○/×でアノテーションしたキャッチコピーデータの予測において、テキストデータの他に母音の情報や品詞数を入力として与えた研究です。実験ではテキストのみの場合よりも母音情報・品詞数情報などを追加した方が高い精度となったことを述べています。
テキスト広告やキャッチコピーなどは著者の指摘する通り、単語情報以外にも韻や対句など表現的な部分に特徴があるように思います。それを特徴量として取り入れるというのは非常に興味深い内容でした。
宿泊予約サイトにおけるレビュー自動分類
- 著者:伊草 久峻(東京大学大学院工学系研究科システム創成学専攻), 鳥海 不二夫(東京大学大学院工学系研究科システム創成学専攻)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_1L4GS504/_article/-char/ja
楽天トラベルデータのユーザ評価およびユーザレビューを対象とし、ユーザ評価項目である「立地」「部屋」「食事」「風呂」「サービス」「設備」の6項目について、テキスト情報を用いたレビュー文の分類、各項目の極性分類による評価結果の推定、推定結果への影響が大きいテキストの抽出を行った研究です。
推定結果に影響の大きいテキスト抽出について、「また来たい」や「二度と利用しない」などの包括的なテキストが注目され原因となる部分が上位として出現しない点などを課題として挙げていました。このような包括的な文は特定の項目によらず出現すると考えられることから、他項目でも出現するような文のスコアを下げることである程度改善するように思いました。
覚醒水準による人狼プレイヤの特徴分析の試み
- 著者:山本 浩隆(京都産業大学), 御手洗 彰(京都産業大学), 棟方 渚(京都産業大学)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_2F4OS20a02/_article/-char/ja
皮膚電気活動の測定による、人間の集中力やパフォーマンスの指標として用いられる覚醒水準を用いて人狼ゲームにおけるプレイヤーの傾向を分析した研究です。人狼ゲームに関する研究ではエージェントの戦略や対話システムに関する研究が多いため生体信号を用いた分析は珍しく、非常に興味深い内容でした。
今回の研究では勝率の高いプレイヤー/勝率の低いプレイヤーでカミングアウト時の皮膚電気活動に差があることを述べていましたが、それ以外の場面、特にパワープレイなどより高度な立ち回りが要求される場面における分析結果がどのようになるかは気になるところです。
協力ゲームHanabiにおける人間の個性とエージェントの評価の間にある関係の調査
- 著者:川越 敦(筑波大学), 大澤 博隆(筑波大学)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_2F4OS20a03/_article/-char/ja
協力型のボードゲームである「Hanabi」において、リスク傾向の高いエージェントとリスク傾向の低いエージェントについて、人間のリスク傾向によってエージェントに対する評価がどのように変化するかを調べた研究です。ゲームのエージェントに関しては勝率などに着目した研究が多いですが、一緒にプレイして人間が楽しめるエージェントに関する研究も今後は重要になってくると思います。そういった点で人間とエージェント間の行動傾向の類似度とエージェントに対する評価の関係について分析した研究は非常に意義のあるものだと感じました。
複数の言語モデルを考慮したキーワードからの広告文生成
- 著者:張 浩達(東京工業大学), 上垣外 英剛(東京工業大学), 高村 大也(東京工業大学, 産業技術総合研究所), 奥村 学(東京工業大学)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_2H6GS905/_article/-char/ja
MHアルゴリズム(メトロポリス・ヘイスティングス法)を文生成に適用したCGMHという手法に対して、文長や指定キーワードの位置などの制約を与える拡張を行ったほか、形態素単位、サブワード単位、文字単位の複数粒度の言語モデルを組み合わせて使用することでより良い生成結果となることを示した研究です。汎用的な生成手法に対して特定の制約を与えるという考えは単純でありながら特定のドメインに特化した生成を行う上では重要な考えだと思います。
創作の未来における人工知能と小説家
- 著者:山口 昌志(愛知大学, 日越大学)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_3D1OS22a01/_article/-char/ja
小説家でもある著者が創作支援ソフトウェアを使用した創作過程について紹介し、今後の創作支援ソフトウェアに求められるものについて述べた「創作者と人工知能が創る創作の未来」セッションの招待講演です。著者は対話形式の創作支援ソフトウェアが考えの整理に適していることやプロの小説家に対して必要なのは「読者のための創作支援」であること、「編集者」の役割が創作支援として求められることなどを述べています。
人工知能技術による創作支援は個人的にも将来的に関わりたい領域のため、プロの小説家の視点からみた創作支援ソフトウェアのあり方に関する話は非常に興味深く参考になる内容でした。その一方で一口に創作支援と言っても、例えば初心者とプロの方など、対象とする相手のレベルによって求められる機能は全く異なるようにも思い、改めて創作支援という分野の難しさを感じました。
Focal Lossを利用したBERTによる小説の段落境界推定
- 著者:飯倉 陸(大阪府立大学), 岡田 真(大阪府立大学工学研究科), 森 直樹(大阪府立大学工学研究科)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_3D1OS22a02/_article/-char/ja
小説の段落境界推定において、BERTの損失関数としてFocal Lossを利用することでBinary Cross Entropy Lossを利用した際よりも精度が向上することを示した研究です。画像処理分野の物体検出でクラス間の不均衡性に対処するために使用されているFocal Lossを小説の段落境界に適用したという点が面白いです。小説における段落分けは著者が述べているとおり場面や話題の変化を基準として行われることが多く、その点を踏まえると段落分けの支援にとどまらず、書かれた文章に対する内容の分析などの際にも活用できる可能性があるように感じました。
単語埋め込みのノルムと方向ベクトルを区別した文間最適輸送コスト
- 著者:横井 祥(東北大学, 理化学研究所), 高橋 諒(東北大学, 理化学研究所), 赤間 怜奈(東北大学, 理化学研究所), 鈴木 潤(東北大学, 理化学研究所), 乾 健太郎(東北大学, 理化学研究所)
- 予稿:https://www.jstage.jst.go.jp/article/pjsai/JSAI2020/0/JSAI2020_3Q5GS903/_article/-char/ja
2文間の意味的類似性(STS)について、単語ベクトルのノルムと方向ベクトルがそれぞれ単語の重要度と意味に対応していることから、それらを分割して扱う文類似度評価尺度Word Rotator's Distance(WRD)を提案しています。実験では既存のWord Movers' Distance(WMD)と比較して提案手法のほうが人手評価との相関係数において改善が見られたことや適切なアラインメントを取ることができたことなどを示しています。
おわりに
今回の人工知能学会ではオーガナイズドセッションとして「広告とAI」というセッションが行われるなど、インターネット広告に関する研究が活発化していることを改めて感じました。広告実績に関する研究開発等は弊社でも行っており、今回のセッションの内容も非常に参考になりました。また、実務に直接関係する発表以外にも「創作者と人工知能が創る創作の未来」や「人狼知能と不完全情報ゲーム」をはじめ個人的に非常に興味深いセッションが多く刺激になりました。
オンラインでの学会参加は3月の言語処理学会に続き2回目となりますが、聴講者としてはセッション間の移動が容易になることによって興味のある発表を比較的漏らさず聞くことができるという点はオンラインの大きな利点だと感じます。
来年のJSAI2021は仙台で開催とのことでしたが、来年には新型コロナウィルスが落ち着き現地で開催できるようになっていることを祈っております。
Opt Technologiesに興味のある方は、こちらから「カジュアル面談希望」と添えてご応募ください!
*1:熊谷 雄介, 久原 卓, 三木 一弘, 町田 尚基, 藤原 晴雄, 道本 龍, 画像広告のクリック予測における高次の特徴量の検討, 第34回人工知能学会全国大会, 2020
*2:石川 隆一, 林 秀和, 複数の入力を用いたキャッチコピーの評価, 第34回人工知能学会全国大会, 2020
*3:伊草 久峻, 鳥海 不二夫, 宿泊予約サイトにおけるレビュー自動分類, 第34回人工知能学会全国大会, 2020
*4:山本 浩隆, 御手洗 彰, 棟方 渚, 覚醒水準による人狼プレイヤの特徴分析の試み, 第34回人工知能学会全国大会, 2020
*5:川越 敦, 大澤 博隆, 協力ゲームHanabiにおける人間の個性とエージェントの評価の間にある関係の調査, 第34回人工知能学会全国大会, 2020
*6:張 浩達, 上垣外 英剛, 高村 大也, 奥村 学, 複数の言語モデルを考慮したキーワードからの広告文生成, 第34回人工知能学会全国大会, 2020
*7:山口 昌志, 創作の未来における人工知能と小説家, 第34回人工知能学会全国大会, 2020
*8:飯倉 陸, 岡田 真, 森 直樹, Focal Lossを利用したBERTによる小説の段落境界推定, 第34回人工知能学会全国大会, 2020
*9:横井 祥, 高橋 諒, 赤間 怜奈, 鈴木 潤, 乾 健太郎, 単語埋め込みのノルムと方向ベクトルを区別した文間最適輸送コスト, 第34回人工知能学会全国大会, 2020