目次
生成式AI (Generative AI),即人工智慧生成內容,又稱AIGC(AI Generated Content)。
生成式AI是人工智慧中的一個分支,主要用於創造性的工作,例如文章生成、影像生成、音樂生成等。現下討論最夯的ChatGPT、Midjourney、Stable Diffusion,以及Office 365 Copilot都是生成式AI的最佳應用。
本文將為你講解生成式AI的基本原理以及一些實際應用情境,讓你更深入了解人工智慧的創造力。
生成式AI的基本原理
生成式AI是通過學習大量的數據,從而可以生成與原始數據相似的新數據。它主要依賴於深度學習技術,其中最常見的是生成對抗網絡、長短期記憶網絡、Transformer模型。生成對抗網絡 (Generative Adversarial Networks, GAN)
生成對抗網絡是由兩個功能組成的系統:
1. 生成器(Generator),用於生成假的數據2. 鑑別器(Discriminator),用於區分真假數據。
運作方式是由生成器透過反覆生成假數據並且調整參數,嘗試讓其生成的假數據越來越接近真實數據。而鑑別器則不斷辨別真假數據,並調整參數以提高辨識能力。這種反覆訓練的過程,可以讓生成器學習到如何生成更加真實的數據,而鑑別器則可以不斷提高辨識真假數據的能力,從而形成一個不斷進化的系統。
長短期記憶網絡(Long Short-Term Memory, LSTM)
長短期記憶網絡主要用於文本生成方面。它可以通過學習一個大量的文本數據集,並且記住前面的單詞,預測下一個單詞。舉例來說,假設我們有一個簡單的文本數據集:“The cat sat on the mat”,當LSTM網絡訓練完成後,我們可以輸入“the cat”作為起始點,然後LSTM網絡可以預測下一個詞為“sat”,接著我們可以將“sat”作為新的起始點,再次輸入LSTM網絡中,繼續生成下一個詞,如此反覆,直到生成一個完整的句子。Transformer模型
Transformer是一種非常強大的神經網絡模型,它可以用於自然語言處理、圖像處理、音頻處理等各種生成式任務。它最主要的特點就是它使用了一種被稱為注意力機制的技術,這種技術可以幫助模型更好地理解輸入數據,而ChatGPT就是用Transformer模型進行訓練的。假設我們想讓ChatGPT模型回答以下問題:“小明喜歡吃什麼水果?”我們可以這樣問:「小明喜歡吃哪種水果?」
對於這個問題,ChatGPT首先會通過對已知知識的理解,識別到“小明”是一個人名,而“水果”是一種食物。然後,它會使用注意力機制來關注問題中的關鍵字,如“喜歡”、“吃”和“水果”,以此來理解問題的含義。
接著,ChatGPT會通過對訓練數據的學習,了解到“小明”喜歡吃哪些水果,例如蘋果、香蕉、橙子等等。然後,它會使用這些知識來生成回答,例如:“小明喜歡吃蘋果。”
這就是一個使用Transformer模型的例子。Transformer模型能夠自動從數據中學習知識,並生成適當的回答,這使得它在各種生成式任務中都有著非常出色的表現。
實際應用情境
領域範疇 | 應用說明 |
音樂生成 |
生成式AI可以學習一個大量的音樂作品,然後通過生成器生成新的音樂作品。例如,Magenta Project就是一個由Google研發的生成式AI項目,可以生成各種風格的音樂,例如爵士樂、搖滾樂等。 |
影像生成 |
生成式AI可以通過學習一個大量的圖像數據集,從而生成與原始圖像相似的新圖像。例如,目前討論度最高的Midjourney就是屬於這方面的應用。 |
文本生成 |
生成式AI可以學習一個大量的文本數據集,從而生成與原始文本相似的新文本。例如,ChatGPT就是一個由OpenAI研發的生成式AI項目,可以生成各種主題的文章、新聞、詩歌等。 |
語音生成 |
生成式AI可以通過學習一個大量的語音數據集,從而生成與原始語音相似的新語音。例如,Lyrebird就是一個由加拿大研究人員研發的生成式AI項目,可以生成與原始語音相似的人工語音。 |
設計生成 |
生成式AI可以學習一個大量的設計數據集,從而生成與原始設計相似的新設計。例如,Autodesk Generative Design就是一個由Autodesk研發的生成式AI項目,可以生成各種設計,例如橋樑、建築、機械等。 |
2023是各類型AI爆發性成長的一年,尤其是生成式AI在OpenAI開發的ChatGPT引領下,引起各界廣泛的討論。隨著各大巨頭爭相發展生成式AI的技術,我們可以期待更多新的應用情境的出現。