ソフトバンクの子会社であり、生成AIを活用した事業を展開するGen-AX(ジェナックス)ではSaaSとコンサルティングの事業を柱としている。そのうちSaaS事業ではコールセンター向けの業務を自動化するプロダクトを提供していく。ベースとなるのは、ソフトバンクと日本マイクロソフトが共同開発しているシステムだ。そのシステムを活用し、顧客に最適化したプロダクトを開発している。また、コンサルティング事業では、生成AIを社内に導入するための支援サービスを手がけている。
2024年7月に本格的に事業を開始したGen-AXのCEOに就任したのは、LINE株式会社(現:LINEヤフー株式会社)のAIカンパニーでCEOを務め、AIテクノロジーブランド「LINE CLOVA」の開発などを牽引した砂金 信一郎さんだ。
生成AI戦国時代の中、なぜコールセンター向けのサービスを事業の軸にしたのだろうか。そして、音声AI領域の第一人者は、どのようなチームをつくり、事業を展開しようと考えているのだろうか。
関連記事:「要素技術の組み合わせで、キャリアを紡いできた」|Gen-AX CEO 砂金 信一郎

砂金 信一郎
Gen-AX CEO。マイクロソフトでエバンジェリストを経験したのち、LINE(現:LINEヤフー)に転職。AIテクノロジーブランド「LINE CLOVA」の開発などを牽引する。同社のAIカンパニーのCEOを経て現職。
目次
インパクトの大きいコールセンターの領域で新しいプロダクトを開発
音声認識の市場は急激に成長している。GPT-4oでは音声データからテキストを生成できるようになり、音声データからAIが自動で文字を起こすソフトウェアの精度は向上している。
ただ、音声領域におけるAIの活用はまだ限定的だ。オフィスワークなどの業務で採用できる音声領域のソフトウェアは少なく、市場の需要に技術の発展が追いついていない。この状況に対して砂金さんは「音声AIの領域はまだまだブルーオーシャンです」と断言する。
「AIを活用した音声サービスはいくつかありますが、不満を抱えている人も多いです。思った通りの答えをもらえない、ズレた回答がくる。AIの機能が期待値に達していないということですよね。理想と現実にギャップがある状態です。伸びしろがあるとも言えます」

生成AIと音声認識を組み合わせたユースケースにはどのようなものがあるのだろうか。
Gen-AXが手がけているのは、コールセンターを含むカスタマーサポート領域を中心にした生成AIを業務改革などに活かすためのSaaSプロダクトの提供だ。その中でもコールセンターを設けている企業は多い。スタッフが問い合わせに対する対応を行っており、もしこの領域に生成AIを活用できれば、コールセンターのあり方を一変させることができる。
ただ、コールセンターの業務は複雑だ。実際のオペレーションは一問一答で進まず、会話が無数に分岐していく。これまでもAIは活用されてきたが、業務を任せられるのは質問への回答フローを構築できる定型的なやり取りのみだった。飲食店の予約や宅急便の集荷予約などがその代表例に当たる。
しかし、学習データからアウトプットを出力できる生成AIを活用できれば、一つひとつのフローを設計する必要はなくなる。汎用人工知能であるAGIの開発が予測できるほど、生成AIが進化したことで、コールセンターへの生成AI活用も現実的なものになった。
「たとえば、ソフトバンクのコールセンターで機種変更の問い合わせを受けたとしましょう。問い合わせの対応は、顧客の契約内容の確認から始まります。ただ、その後は、どのプランを契約しているのか、デバイスを複数台持っているのかなど、確認するポイントが多いです。
AIがこの業務を担うことを考えた場合、非常に複雑な判断が必要です。問い合わせを受けたAIが、タスクを分解し、そのタスクを実現するために不足している情報を考え、情報不足を解消するための検索行動を取り、顧客へアクションを返さなければいけない。乗り越えるべき課題は多いですけど、トライできることも多い。ここを乗り越えられると社会的なインパクトの強いプロダクトが完成すると思います」
生成AIの領域に向くエンジニアは、知的好奇心が強く手を動かせる人

生成AIを活用したプロダクトの開発に取り組み始めたGen-AXは、少数精鋭のエンジニアチームのビルディングを始めている。その中で重視しているのは、多様性だ。
立ち上がったばかりの組織は単一的なカルチャーになりやすい。事業をドライブさせるために、ハイコンテクストな文脈を共有できるメンバーで構成されることが多いためだ。なぜ、Gen-AXでは多様性を根底とした組織体制を目指しているのだろうか。
「多角的な議論ができないとプロダクトのクオリティが上がらないんですよ。それぞれの異なる視点で議論し、気づきを共有しながら、プロダクトを仕上げていく。信頼と尊敬をもって議論ができる組織にしたいですね」
チームには多様性が必要だが、一方で、生成AIの領域に携わるエンジニアにはある適性が求められる。それは技術への知的好奇心だ。
「GPT-4oがリリースされたとき、一気に機能が進化しましたよね。このように高機能な生成AIが突然リリースされるという可能性はあります。その不確実性を楽しめるタイプは生成AI領域のエンジニアに向いていると思います。逆に、新しい生成AIが出現したときに、積み上げた技術が台無しになると落ち込むタイプは向きません。
また、新しい技術の登場に対して、その技術のトライを義務のように感じて、背負い込んでしまうタイプもしんどくなると思います。新しい技術を試すのが楽しく、そのメリットとデメリットを把握した上で前向きにプロダクトへ導入していく。そんな開拓精神の強い人が力を発揮できる業界だと思います」
生成AIの領域には開拓できる荒野が無限に広がっているため、技術への探究心の強いエンジニアにとっては願ってもいない環境だ。
また、Gen-AXでは未知の環境に胸を高鳴らせ、生成AIに本気で取り組みたいエンジニアと事業を成長させていきたいと考えているという。
「これから生成AIに本気で取り組んでいこうと思っている方と一緒に、チームをつくっていければと思います。たとえば、本業で要素技術の検証や事業開発に携わり、プライベートで生成AIのプロダクトを開発しているようなエンジニアの方はたくさんいますよね。その中でも生成AIの領域に仕事として取り組みたいと考えている人たちとご一緒できればと願っています」

グローバルスタンダードとなるプロダクトの開発を目指す
生成AIを活用したコールセンターのプロダクト開発に取り組んでいるGen-AX。まずは、生成AIの回答の精度を上げるために、RAG(検索拡張生成)の開発から始めている。その開発で検討していることが2つある。自然言語をAIが扱いやすい数値データに変換するエンベディングのファインチューニングと、検索情報の順位づけを行うリランカーの調整だ。
「ChatGPTやClaudeなどのLLMをフルファインチューニングできるのが理想です。ただ、コストパフォーマンスを考えると現実的ではありません。でも、何らかのファインチューニングを施さないと業務で活用できるものにはならない。そこで、エンベディングに社内用語や業界特有の用語を学習させるということを検討しています。また、リランカーを調整しないと、生成AIが探索するときに、正確な情報にたどり着けません。必然的にアウトプットも悪くなります。生成AIの能力をフルに発揮して業務改善につなげるには、企業や業界に適した調整が必須です」
また、Gen-AXではプロダクトの実装に伴走するコンサルティングの事業も立ち上げている。このことから、プロダクトを通じたビジネスの成果を重視している姿勢もうかがえる。
さらに、プロダクトの開発領域をコールセンターからセールスの領域へ拡張することも見据えているという。
「コールセンターとセールスの領域は近接しているんですよね。ユーザーの契約や解約へとつながる行動データはマーケティングの部署が持っていることが多いですが、コールセンターのような顧客と接点のある場所とそれらのデータを接合できたらと考えています」
ビジョンを描きながらも着実にプロダクトの開発に取り組んでいるGen-AX。その最終的に向かう先はグローバルな市場だ。砂金さんは「グローバルスタンダードとなるプロダクトをつくっていきたいです」と決意を述べた。
「要素技術を組み合わせて新しいプロダクトを生み出すのは、日本の得意としている領域です。これまでもソフトウェアを使ってゲームなどのアプリをたくさん生み出し、新しい市場をつくってきました。ビッグテックが生成AIを生み出していますが、その技術を組み合わせると新しい価値のあるプロダクトを創ることができます。未開の荒野が広がっていて、その荒野には大きなチャンスが眠っています。日本発で世界のスタンダードとなるようなプロダクトをつくっていきたいです」
