AI
NEWS.速報
ネットの今を、最速で。
特集AI比較
LIVE
[OpenAI] OpenAIが初の自社カスタムチップ「Jalapeño」をBroadcomと共同開発[Google] Google、Gemini 3.5 Flashにコンピュータ操作機能を追加[OpenAI] OpenAIとBroadcom、LLM推論専用カスタムAIチップ「Jalapeño」を発表[AI] untitled[GPT-5] GPT-5がT細胞の謎を解明、免疫学研究に突破口[OpenAI] OpenAI、先進AI共通標準の構築支援とAppia財団設立に参画[Groq] AIチップ企業Groqが6億5000万ドル調達、Nvidiaとの買収未遂後に再始動[ChatGPT Enterprise] Samsung電子、ChatGPT EnterpriseとCodexを全社導入[OpenAI] OpenAI「Daybreak」発表:組織のセキュリティ強化を支援する新AIツール群[AI] untitled[Apple] iOS 27発表:Siri以外のAI実用機能まとめ[AI倫理] Signal代表がAIチャットボットは「友達でも意識ある存在でもない」と警鐘[OpenAI] OpenAIが初の自社カスタムチップ「Jalapeño」をBroadcomと共同開発[Google] Google、Gemini 3.5 Flashにコンピュータ操作機能を追加[OpenAI] OpenAIとBroadcom、LLM推論専用カスタムAIチップ「Jalapeño」を発表[AI] untitled[GPT-5] GPT-5がT細胞の謎を解明、免疫学研究に突破口[OpenAI] OpenAI、先進AI共通標準の構築支援とAppia財団設立に参画[Groq] AIチップ企業Groqが6億5000万ドル調達、Nvidiaとの買収未遂後に再始動[ChatGPT Enterprise] Samsung電子、ChatGPT EnterpriseとCodexを全社導入[OpenAI] OpenAI「Daybreak」発表:組織のセキュリティ強化を支援する新AIツール群[AI] untitled[Apple] iOS 27発表:Siri以外のAI実用機能まとめ[AI倫理] Signal代表がAIチャットボットは「友達でも意識ある存在でもない」と警鐘
HOME/GoogleGoogle

Google、Gemini 3.5 Flashにコンピュータ操作機能を追加

GoogleがGemini 3.5 Flashにコンピュータ操作機能を導入しました。
satoshi
2026/06/24 JST
📖 4分で読める🔥 HOT 10.0
// SATOSHI'S TAKE — まず結論から
管理人の見解
satoshi
satoshi / 管理人

Geminiにcomputer use来たか。Claudeのそれは触ってるけど、Gemini版はまだ試してない。

Google
Google.
// 3行まとめ
TL;DR
  • 01GoogleがGemini 3.5 Flashにコンピュータ操作機能を導入しました。
  • 02AIが画面を認識し、実際のPC操作を自律的に実行できます。
  • 03軽量モデルへの実装により、幅広い用途での活用が想定されます。

GoogleがGemini 3.5 Flashにコンピュータ操作機能を導入しました。

AIが画面を認識し、実際のPC操作を自律的に実行できます。

軽量モデルへの実装により、幅広い用途での活用が想定されます。

#01 何が起きたのか

2026年6月25日、GoogleはAIモデル「Gemini 3.5 Flash」にコンピュータ使用機能(Computer Use)を導入したと発表しました。この機能は、AIが画面上の表示内容を視覚的に認識し、マウスのクリックやキーボード入力などのPC操作を自律的に実行できる能力を指します。

Gemini 3.5 Flashは、Googleが提供する比較的軽量かつ高速な推論に特化したモデルです。今回の発表では、この軽量モデルに対してコンピュータ操作機能を統合したことが明らかにされました。AIエージェント(自律的にタスクを実行するAIシステム)がウェブブラウザやデスクトップアプリケーションを直接操作し、複数のステップにわたる作業を連続して遂行することが可能になります。Google DeepMindの公式ブログにて、機能の概要と対応する操作の範囲が公開されています。

#02 なぜ重要なのか

コンピュータ操作機能は、AIエージェントの実用化において重要な技術的マイルストーンとされています。これまでAIはテキストや画像の生成・解析を主な役割としていましたが、コンピュータを直接操作できる能力を持つことで、人間が行っていたデジタル作業の自動化が可能になります。

また、今回の実装先がGemini 3.5 Flashという軽量モデルである点も注目されます。OpenAIやAnthropicも同様のコンピュータ操作機能を上位モデルで提供しており、軽量モデルへの展開はコスト面での競争力や開発者向けAPIでの利用しやすさに直結します。AI各社がエージェント機能の拡充を競う中、Googleの軽量モデルへの機能統合は業界全体の技術動向に影響を与えるものとみられます。

#03 で、私たちの生活にどう影響?

この機能が一般向けサービスや開発者向けAPIを通じて広く利用可能になった場合、日常的なデジタル業務の自動化が現実的な選択肢となります。たとえば、複数のウェブサイトから情報を収集して表にまとめる作業や、定型的なフォームへの入力、ファイルの整理といった繰り返し作業をAIに任せることが考えられます。

一般ユーザーにとっては、AIアシスタントへの指示一つで複数のアプリをまたいだ操作が完了するシナリオが近づきます。ただし、AIがコンピュータを操作する際のセキュリティやプライバシーの管理については、ユーザー自身が設定や権限を適切に確認することが引き続き求められます。


Flashって軽量モデルに積んできたのがポイントで、APIコスト的に使いやすくなるのは素直にヤバいと思う。

Claude Code派だから乗り換えはないけど、エージェントの選択肢が増える分には歓迎。週末に少し叩いてみる気がする。

#Google#Gemini#コンピュータ操作#AIエージェント#マルチモーダル
この記事、役に立った?
シェアして仲間に教えよう
// SOURCE(公式一次情報)
Google DeepMind
← 古い記事
OpenAIとBroadcom、LLM推論専用カスタムAIチップ「Jalapeño」を発表
新しい記事 →
OpenAIが初の自社カスタムチップ「Jalapeño」をBroadcomと共同開発
← トップへ📋 全記事一覧
// RELATED

関連記事