AI 全面進場！一文睇 Google I/O 2024

alex 2024-05-15 09:51 | 科技新知

今（15日）凌晨首日舉行的 Google I/O 開發者大會「主題演講」結束，2 小時的會議主要集中在 AI，Google 的 Gemini（前身 Brad） AI 模型及如何整合到各種 Google 服務當中。

螢幕截圖 2024-05-15 上午9.34.36.png

Gemini 模型更新：更快更強大

Google 推出了新的 AI 模型 —— Gemini 1.5 Flash。這款多模態模型與 Gemini 1.5 Pro 一樣強大，但對於「大規模、高頻率」的任務更加優化，能夠更快速地生成回應。此外，Google 對 Gemini 1.5 進行了一些改進，提升了其翻譯、推理和編程的能力。

另外，Gemini 1.5 Pro 亦作出優化，其脈絡長度擴展至 200 萬個詞元脈絡長度（token），可處理達 1500 頁文件、為 100 封電子郵件摘要，或處理長達 1 小時的影片內容。此外，Gemini 1.5 Pro 關於增強了編寫程式碼、推理、理解音訊和圖像的能力。

▲新增 Gemini 1.5 Flash 模型。

Google Lens 支援影片搜尋

以往 I/O 都主要講 Android 新功能或 Google 的新服務，但今次就全程講 AI。首先圖片搜尋功能 Google Lens 再提升，新增了通過影片來搜尋。即是你可以拍攝一段影片，對著想要搜尋的物品提問，Google 的 AI 將嘗試從網絡上找到相關答案。

And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024

「Ask Photos」功能：智能管理你的照片庫

Google 將在今年夏天推出一項新功能，這對於那些擁有多年甚至十多年照片的用戶來說是一大福音。「Ask Photos」功能讓 Gemini AI 能夠根據你的提問，深入你的 Google 照片庫中尋找答案。CEO Sundar Pichai 示範了如何查詢他的車牌號碼，結果不僅顯示了號碼，還展示了相應的照片，以便確認。

Gemini 整合到 Workspace 可生成會議摘要

Google 將其最新的主流語言模型 Gemini 1.5 Pro 整合到了 Docs、Sheets、Slides、Drive 和 Gmail 的側邊欄中。當這項功能下個月向付費訂閱者推出時，它將成為 Workspace 中的助理，可以在 gmail、meet 中為信件與會議作出摘要，簡單生成懶人包。

螢幕截圖 2024-05-15 上午1.16.40.png

▲Meet 會議可生成摘要。

螢幕截圖 2024-05-15 上午1.16.28.png

▲gmail 側邊亦會製作出摘要。

Gemini 變得更擅長對話

新推出的 Gemini Live 功能旨在使與 Gemini 的語音聊天感覺更自然。聊天機器人的語音將更新，增添更多個性。另外，「Project Astra」功能具視覺分析能力，用戶可透過手機鏡頭與 Gemini 對話，AI 會根據拍攝影像作描述和對答，示範影片中更幫用戶找到放在桌上的眼鏡。Gemini 也新增了與 Google 日曆、任務和 Keep 的整合功能。

io副本.jpg

分區列表