Gemini 模型更新:更快更強大
Google 推出了新的 AI 模型 —— Gemini 1.5 Flash。這款多模態模型與 Gemini 1.5 Pro 一樣強大,但對於「大規模、高頻率」的任務更加優化,能夠更快速地生成回應。此外,Google 對 Gemini 1.5 進行了一些改進,提升了其翻譯、推理和編程的能力。另外,Gemini 1.5 Pro 亦作出優化,其脈絡長度擴展至 200 萬個詞元脈絡長度(token),可處理達 1500 頁文件、為 100 封電子郵件摘要,或處理長達 1 小時的影片內容。此外,Gemini 1.5 Pro 關於增強了編寫程式碼、推理、理解音訊和圖像的能力。
▲新增 Gemini 1.5 Flash 模型。
Google Lens 支援影片搜尋
以往 I/O 都主要講 Android 新功能或 Google 的新服務,但今次就全程講 AI。首先圖片搜尋功能 Google Lens 再提升,新增了通過影片來搜尋。即是你可以拍攝一段影片,對著想要搜尋的物品提問,Google 的 AI 將嘗試從網絡上找到相關答案。And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024
「Ask Photos」功能:智能管理你的照片庫
Google 將在今年夏天推出一項新功能,這對於那些擁有多年甚至十多年照片的用戶來說是一大福音。「Ask Photos」功能讓 Gemini AI 能夠根據你的提問,深入你的 Google 照片庫中尋找答案。CEO Sundar Pichai 示範了如何查詢他的車牌號碼,結果不僅顯示了號碼,還展示了相應的照片,以便確認。Gemini 整合到 Workspace 可生成會議摘要
Google 將其最新的主流語言模型 Gemini 1.5 Pro 整合到了 Docs、Sheets、Slides、Drive 和 Gmail 的側邊欄中。當這項功能下個月向付費訂閱者推出時,它將成為 Workspace 中的助理,可以在 gmail、meet 中為信件與會議作出摘要,簡單生成懶人包。▲Meet 會議可生成摘要。
▲gmail 側邊亦會製作出摘要。