機械学習でポートフォリオを最適化──「解釈可能なAI」が運用の現場を変える
ブラックボックスではない、運用者が理解・管理できるAIモデルの設計手法とは。

ESG(環境・社会・ガバナンス)投資の急拡大に伴い、企業のESGパフォーマンスを定量的に評価する「ESGスコア」の重要性が高まっています。しかし現状では、主要評価機関間のスコア相関が低く(MSCIとSustainalyticsの相関係数は約0.6)、投資家にとって「どのスコアを信じるか」が大きな課題となっています。
評価のばらつきが生じる主因は、企業開示データの質と量の不均一性です。大企業は詳細なサステナビリティレポートを公開する一方、中小企業では基本的な環境データすら開示されていないケースが少なくありません。このデータギャップを埋めるために、AIを活用した代替データ分析が注目されています。
当研究所が取り組んでいるのは、自然言語処理(NLP)を用いた非構造化データからのESG情報抽出です。ニュース記事、SNS投稿、規制当局の公開文書などから環境リスクや社会的論争の兆候を検出し、開示データを補完します。特に日本語特化のBERTモデルを用いることで、国内企業に関する日本語情報源からの精度を向上させました。
ただし、AIベースのスコアリングには固有のリスクもあります。学習データに含まれるバイアスがスコアに反映される可能性、ブラックボックス性による説明責任の問題、そしてデータソースの品質管理です。当研究所では「スコアの不確実性」を数値化し、信頼区間付きのESGスコアを提供する枠組みを開発しています。