生成AI は、すでにさまざまな企業の開発現場で活用され始めており、Google Cloudの生成AI ソリューション(Vertex AI および Gemini)の進化も著しいです。

本記事では『Developer eXperience Day 2024』(主催:日本CTO協会)における、グーグル・クラウド・ジャパンの講演「エンジニアの才能を最大限に引き出す-Googleの生成AIが実現する開発生産性の向上-」の模様を、ITエンジニアでもある筆者の感想も交えながらレポートします。

橋口 剛
グーグル・クラウド・ジャパン合同会社
AI事業本部 執行役員 事業本部長

大学卒業後システム会社の営業、ベンチャーでのプログラマ、コンサルティング会社、データ分析ソフトウェア ベンダーでの営業を経て、2011 年に Google に技術営業職として入社。2015 年、社内にて営業職へ異動。営業執行役員を経て 2024 年より生成 AI 事業本部長に着任。

菅野 信
グーグル・クラウド・ジャパン合同会社
執行役員 ストラテジー&オペレーション 市場創出担当

Google Cloud Japan にて、市場創出に関する戦略立案を主導。フィンランド・NOKIA で OSS ベースの携帯OSの開発、スタートアップにて高齢者向け SNS サービスの起業活動等を経て、 2014 年 に Google に入社。

生成AIを用いて、いかに開発生産性を上げるか(講演者: 橋口氏)

こんにちは、橋口と申します。私は現在どちらかといえば営業側にいますが、以前はエンジニアリング領域で自前のCI/CDシステムを作成したり、アプリアーキテクチャのところでチーム全体の開発生産性を上げる、といったことをしていた経験があります。今日は「生成AIを用いていかに開発生産性を上げるか」というテーマでお話をさせていただきます。

Geminiの3つの特徴

まず、Googleの生成AIモデルである「Gemini」についてご紹介します。Geminiはテキスト、動画、画像、音声をシームレスに扱えるマルチモーダルAIモデルです。FORESTERさんのAI基盤モデルのレポートにおいても、非常に高い評価をいただいています。

ここでは、特に重要な3つの特徴をご紹介します。

1つ目が、マルチモーダル対応です。テキストだけでなく、動画、画像、音声も統合的に扱えます。

2つ目は、柔軟なモデルサイズを提供していること。生成AIを選ぶ際に重要な「品質」「コスト」「応答速度」について、用途に応じたサイズとバージョンを提供し、コストパフォーマンスと高品質を両立しています。

3つ目の特徴が、ロングコンテキスト対応です。大量のデータをプロンプトに入力することができ、詳細な分析や応答が可能です。

もう少し具体的に掘り下げていきましょう。

まず、マルチモーダル対応について。これはエンジニアがさまざまな形式のデータを一元的に扱う上で非常に重要です。たとえば、開発中のプロジェクトでは、テキストのドキュメントだけでなく設計図や動画のチュートリアル、音声によるフィードバックなど多岐にわたる情報が必要になります。Geminiはこれらの異なるデータ形式を統合し、エンジニアが必要な情報を一箇所で取得できるようにします。

次に、品質・コスト・応答速度についてですが、これは企業が生成AIを選定する際の重要な要素です。Geminiは用途に応じたサイズとバージョンを提供することで、各企業のニーズに応じた最適なソリューションを提供します。たとえば、低コストで迅速な応答が求められるプロジェクトもあれば、応答速度が低くとも高品質な応答が求められるプロジェクトもあります。Geminiはこれらの要件をバランス良く満たすことができます。

最後に、ロングコンテキスト対応についてですが、これは大規模なデータセットを扱う際に非常に有用です。

たとえば、大量のソースコードやドキュメントを解析する場合、Geminiはそのデータ全体をプロンプトとして入力し、必要な情報を迅速かつ正確に抽出することができます。これにより、エンジニアは効率的に作業を進めることができ、生産性を大幅に向上させることができます。

これらの特徴について、実際にデモを交えてご説明します。

Gemini 1.5 Proの代表的な実例デモ

音声記録の解析: アポロ11号の月面着陸に関する402ページのPDFをGeminiに入力し、特定の瞬間を示す手書きの絵がどの部分に該当するかを特定するデモです。

このデモでは、生成AIがPDFの意味を理解し、具体的な質問に応じて適切な回答を返す能力を示しています。たとえば、アポロ11号の着陸シーンを描いた手書きの絵がプロンプトとして提供された際、Geminiはその絵が文章中のどの部分に対応しているかを正確に特定し、関連する情報を抽出することができます。

ソースコード解析: 10万行のソースコードをGeminiに入力し、特定の画像のレンダリング箇所をソースコード内から特定するデモです。

さらに、画像の地形を変更する方法も提案してくれます。このデモは、生成AIが大規模なコードベースを理解し、具体的な指示に基づいて修正や改善を行う能力を示しています。たとえば、特定の3Dレンダリング箇所を修正する際、Geminiは関連するソースコードの部分を特定し、どのように変更すれば良いかを具体的に提供してくれます。

動画のシーン解析: バスター・キートンの無音の映画から特定のシーンを切り出し、意味を理解してシーンを特定するデモです。

このデモでは、生成AIが動画の内容を理解し、特定の瞬間を正確に特定する能力を示しています。たとえば、映画の中で重要なシーンをプロンプトとして提供した際、Geminiはそのシーンが映画のどの部分に該当するかを特定し、関連する映像情報を抽出します。

これらのデモは、生成AIがさまざまな形式のデータを扱い、それを統合して意味のある情報を提供できることを示しています。エンジニアはこれにより、プロジェクトの進行に必要な情報を効率的に取得し、作業の生産性を向上させることができます。

3つの主要レイヤーで構成されるAIプラットフォーム「Vertex AI」

次に、Google CloudのAIプラットフォームである「Vertex AI」について紹介します。

Vertex AIは生成AIを利用したアプリケーション開発のための総合プラットフォームで、モデル選定、チューニング、アプリケーションの統合をサポートします。このプラットフォームは、以下の3つの主要なレイヤーで構成されています。


1. インフラレイヤー: GPUなどのハードウェアリソースを提供し、大規模なモデルのトレーニングや推論をサポートします。これにより、企業は高度なAIモデルを効率的に運用することができます。

2. モデルレイヤー: 多様なAIモデルを提供し、用途に応じたモデルの選定とチューニングを可能にします。Geminiを含む130以上のモデルが利用可能で、企業のニーズに応じた最適なモデルを選択できます。

3. アプリケーションレイヤー: AIエージェントを構築するためのツールとフレームワークを提供し、エンタープライズ向けの高度なアプリケーションを開発できます。これにより、企業はAI技術を活用した革新的なソリューションを迅速に開発・展開することができます。

また、Vertex AIはエンタープライズ環境での利用を前提として設計されており、データのセキュリティやプライバシー保護にも配慮されています。たとえば、企業の機密情報を扱う際には、高度な暗号化技術やアクセス制御機能を利用してデータを保護することができます。

さらに、Vertex AIはスケーラビリティにも優れており、企業の成長に応じてシステムを拡張することが容易です。たとえば、新しいプロジェクトが追加された場合や、既存のプロジェクトが大規模化した場合でも、Vertex AIを利用することで効率的に対応することができます。

業務効率を大幅に向上させるエンタープライズ向けの活用

エンタープライズ向けには、Google Workspaceと連携したGemini for Google Workspace、BigQueryなどを利用したGemini for Google Cloudがあり、メールのドラフト作成や会議記録の要約などが可能です。これにより、エンタープライズ環境でも生成AIを活用して、業務効率を大幅に向上させることができます。

たとえば、Google Workspaceとの連携により、Gmailのメールドラフト作成、Google Drive内のドキュメント要約、Google Meetの会議内容の記録と要約などが自動化され、業務の効率化が図れます。さらに、BigQueryを利用した自然言語でのデータクエリ作成や、セキュリティログの分析も生成AIによって支援されます。

これらの機能は、企業の業務プロセスを効率化し、従業員がより重要な業務に集中できるようサポートします。エンタープライズ向けのアプリケーションでは、機密情報を扱うことが多いため、生成AIが提供するソリューションは高いセキュリティ基準を満たす必要があります。

また、生成AIの利用にはコストがかかりますが、用途に応じた適切なモデルとサービスを選定することで、コスト効率を最大化できます。

たとえば、リアルタイム性が求められない場合には、夜間バッチ処理を利用することでコストを削減できます。生成AIソリューションは、特定の業務要件に合わせてカスタマイズできる柔軟性が求められます。また、ビジネスの成長に応じてスケールアップできる能力も重要です。

生成AIが開発現場にもたらす革新(講演: 菅野氏)

こんにちは、菅野と申します。ここからは「生成AIが開発現場にもたらす革新」というテーマで、具体的なユースケースとデモについてお話しさせていただきます。

エンジニアの生産性を向上させる生成AIの開発プロセス

まず、生成AIがどのように開発プロセスを効率化し、エンジニアの生産性を向上させるかを紹介します。

1. 企画設計段階のサポート: 生成AIは、膨大なドキュメントを短時間で要約し、プロジェクトの方向性を迅速に決定するための情報を提供してくれます。たとえば、情報通信白書などの大規模なドキュメントを要約し、重要なポイントを抽出することで新しいサービスの企画設計に役立てることができます。

2. 開発 – コーディング支援: 生成AIは、コードの自動生成やリファクタリング、バグ修正をサポートし、エンジニアがより迅速に高品質なコードを作成できるようにします。たとえば、ユーザーフローやシステムアーキテクチャ図を入力することで、必要なコードを自動生成することができます。

FlaskとPythonを使ってトリビアを返すWebアプリの作成依頼をプロンプトに投げてみます。app.py、index.htmlなど最小限のFlaskのファイル構成が出力され、簡単なWebインターフェースが立ち上がりトリビアを返してくれました。生成AIが作ってくれたコードもこんなふうに動きます。もちろん、ハルシネーションには注意が必要です。

3. 開発 – コードベースの分析: コードベースの要約や、新しく入ってきたプロジェクトメンバー向けのGetting startedなどのドキュメント作成もやってくれます。昨今のホットトピックでもあるセキュリティ面もカバーしており、脆弱性を見つけて修正のアドバイスをしてくれるといったところまで来ています。システムの安定性を維持しつつ、運用コストを削減することができます。

これらのデモを通じて、生成AIがどのように開発プロセス全体をサポートし、エンジニアの生産性を向上させるか、具体的に理解していただけたと思います。皆さんぜひ触っていただければ、新しい発見があるのではないかと思います。

取材後記:最新のAI技術と実践的なアプローチでヒント満載の講演

本講演では、Google Cloud の生成AIサービスがどのようにエンジニアの生産性を最大化するか、具体的なデモとともにご紹介いただきました。エンジニアが今すぐ試せる実践的なアプローチを提供し、最新のAI技術を活用して、効率的かつ高品質な開発を実現するためのヒントが満載の講演でした。

Google社内の開発でもLLMの活用が進んでおり、すでにソースコードの約半数が生成AIによって生成されたものになっているそうです。

今回ご紹介いただいた内容も、Google Cloudの生成AIのごく一部の機能です。GeminiやVertex AIを実際に触ってみて、自分の目でそのポテンシャルを確かめていきたいです。

(文:星影

presented by paiza

Share

Tech Team Journalをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む