一文詳解甚麼是生成式 AI (Generative AI) + 用途!ChatGPT 以外還有甚麼 AI?

左定坤 (Cho Ting Kwan) 2023-06-01 18:44 | 手機綜合區
在過去的一年,關於 AI 的討論度大幅增加,而且可以見到,愈來愈多品牌都加入了 AI 行列,就像今年 Google I/O 年度開發者大會上,你幾乎一直聽到:AI......AI......Generative AI......,可以看出 Google 也對 AI 相當重視。到底我們常常聽到的 Generative AI,即是生成式 AI,是甚麼的一回事?如果你想更深入了解甚麼是生成式 AI,這篇文章或者可以幫到你了解更多!看下文吧!

FB.jpg

甚麼是生成式 AI?

AI,中文叫做「人工智能」,正如名字所暗示的一樣,它們是人造的,並且可以有模擬自主思考的能力。早前的 AI 應用,包括有電子遊戲中的敵人角色,由電腦控制並看起來是自主做出決策;以及手機上的預測文字功能,根據常用詞,建議你可能想輸入的單詞。

從某程度來說,有的 AI 系統都是基於這些原則運作,它們有一套需要遵循的規則,就像電子遊戲中的角色般,並且它們能夠識別一些指令,並作出回應。

而「生成式 AI」指的,是一種旨在創建某種東西的 AI 系統,可以是文字,可以是圖像,甚至是代碼、音頻、影片等等。在大部分的情況下,生成式 AI 都會由用戶給出提示 (在 AI 世界裡,一般稱為 Prompt),然後 AI 會嘗試創建與描述相符合的東西。

而「非生成式 AI」則可以是像自動駕駛汽車這類的東西,不是為了創建產品,而是使用 AI 來根據數據作出實時調整。

pope-jacket-midjourney-ai.jpg

關於文字的生成式 AI

到目前為止,AI 文字生成對世界產生了好大影響,在 ChatGPT 2022 年末向公眾推出後,迅速受到熱捧,並在一星期內就吸引了超過 100 萬的用戶。簡單來說,它是一個 AI 聊天機械人,可以像與即時通訊軟件上的人聊天般,跟它交談。它有趣的地方在於可以生成文字,所以你可以跟它說「給我寫一篇以莎士比亞風格寫的關於重力的文章」,幾秒鐘後,就可以很神奇的,創建了一篇有莎士比亞風格的文章。

這是一個非常強大的功能,當你意識到它可以處理編碼、公式和數學問題時,就會發現它的能力更加突出。通過一些疑難排解,你可以讓 ChatGPT 幫你建立一個完整的網站,並教你如何將網站上線,你只需要向它提問即可。

而 Microsoft 好快就看到了這潛力,並將 ChatGPT 背後的一些技術,引入了其 Bing 搜索引擎中。因此,你可以直接與 Bing 進行對話,並獲得一些看起來有見地的結果。

正如剛才提到,Google 在 2023 年的 Google I/O 大會上,說了很多關於 AI 的內容,而它為用家帶來的大部分內容,都是關於文字生成式 AI。Google 有自己一套用來取代 ChatGPT 的應用,叫做 Bard,但除此之外,它還將一些 AI 功能注入它們最受歡迎的軟件產品中,例如「Help me write」(幫我寫信)的功能,它會在不久將來加入到 Gmail,提供生成郵件的能力,例如可以提供一個 Prompt,叫 Gmail 幫你寫一封專業的要求退款郵件。我們也可以在 Android 14 的 Google Messages 應用程式入面,看到類似的功能。

how-to-delete-chatgpt-data.jpg

enr_0715.jpg

關於圖像和影片的生成式 AI

就像你可以透過 Prompt 創建文字一樣,你也可透過 AI 創建圖像。圖像的生成式 AI 本質上是一個「文字轉圖像」的轉換器,所以你需要寫下你想要的圖片描述,AI 就會根據你的指令去生成一張圖片。而你可以通過進一步去改善你的 Prompt,改變生成的圖像外觀,所以你可以加一些像「...以黑白漫畫風格」或「...高解像度照片」之類的內容,得到完全截然不同的結果。

說到最受歡迎的圖像生成式 AI 工具,相信應該是 DALL-E 2,與 ChatGPT 相同的是,它都是由 OpenAI ChatGPT 相同團隊開發的。其後愈來愈多競爭對手出現,例如 Stable Diffusion 和 Imagen 等等,這些的圖像生成式 AI 工具,各有它們的優點,大家可以試玩一下。

圖像生成式 AI 已經出現在一些消費者產品之中。例如 Amazon Fire TV Omni QLED 電視,可以讓用家創建生成式 AI 圖像,作為你的 Wallpaper;在 Android 14 智能手機上,也是如此。

如果只是生成圖像都嫌不夠,關於影片的生成式 AI 也在研究之中。畢竟,影片只是一系列快速連續播放的圖像,Google 在 I/O 大會上展示了它的 Imagen AI 影片生成的能力,但目前仍處於研究階段,據說能夠從簡單的文字輸入,並生成 24fps 的高清影片。

turtlebug-stablediffusion-ai-image.jpg

關於音頻的生成式 AI

文字轉語音的技術,已經存在很長時間,但好多時都會明顯聽得出,好像機械人讀書的聲音,而關於這一點,可以通過 AI 得到改變。借助新的機器學習技術,AI 可以生成聽起來你想要的任何人的音頻。

要準確生成某個人的聲音,需要收集那個人的大量音頻樣本,並使用這些樣本去訓練模型。不過,最新的技術只需要幾句話的錄音,就可以生成跟真人相似的聲音。

這種技術在一些應用中相當實用,例如為虛擬角色創建聲音,提供個性化的電話提示音,甚至可以用作 Podcast 用途。

生成式 AI 的潛力

生成式 AI 的應用前景非常廣泛,可以應用於需求創造力的領域,例如藝術和設計,提供你可能沒有想像迥的圖像、音樂和文學作品。它還可以用於教育領域,幫助學生解決問題、編寫文章或生成學習資源。在商業範疇中,生成式 AI 可以用於自動生成內、創建個性化的產品和服務,以及提供與顧客的互動。

當然,這種技術也會帶來一些挑戰以及倫理的問題,例如如何處理虛假信息、版權問題以及技術濫用等。因此,生成式 AI 的發展需要適當的監管以及道德方面的指導。

總結

生成式 AI 是一種人工智能的應用,旨在創建某種東西,例如文字、圖像、影片和音頻。它通常是根據用戶提供的 Prompt 進行操作,並嘗試生成與描述相符的內容。

這種技術在文字生成方面取得了巨大的突破,並且正逐漸擴展到圖像、影片和音頻的範疇。生成式 AI 在藝術、設計、教育和商業範疇上,都有廣泛的應用前景。

然而,隨着這種技術的發展,也需要注意相關的倫理和法律問題,以確保其負面影響得到適當管理。

來源:Pocket-lint

最新新聞