Character Consistency – Introducing 4o Image Generation – Open AI
文字生成 (Text Rendering) 可以正確的在圖像中寫上文字
Text Rendering – Introducing 4o Image Generation – Open AI
風格重塑 (Upload and Restyle) 保留圖片原有的資訊並改整體的風格或是改變圖片的一部份
Upload and Restyle – Introducing 4o Image Generation – Open AI
細節控制 (Detailed Direction) 4o 能接收大量關於圖片的細節描述並完全跟從
Detailed Directions – Introducing 4o Image Generation – Open AI
透明圖層 (Transparent Layers) 生成有透明圖層(例如透明背景)的圖片
Transparent Layers – Introducing 4o Image Generation – Open AI
實際應用
在網絡上已經湧現了大量使用 4o 成生的圖片 其強大的功能使它被迅速傳播
下面就是幾個例子
把「狂草」畫作變為風景畫
Draft – OpenAI’s New Image Generator: An AI Revolution! – Two Minute PapersPhoto – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papers
生成產品海報
Poster – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papers
把 meme 圖改變為不同的風格
meme 1 – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papersmeme 1 restyled – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papersmeme 2 – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papersmeme 2 restyled – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papers
把草圖變換為漫畫
hand drawing – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Paperscomic – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papers
這是因為現時流行的 diffusion 模型的隨機性非常高 而我們看看 Open AI 這次推出的圖像生成 跟 diffusion 模型的從隨機到確定不同 它是從上而下的成生 這代表它很可能不是使用 diffusion 模型 (或是只參與了部份前期工作)
rendering 1 – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papersrendering 2 – OpenAI’s New Image Generator: An AI Revolution! – Two Minute Papers
以前的圖片生成就像是隨便倒一把沙 再慢慢的把沙推到一起變成更清晰的圖像 充滿了隨機性
4o 的圖片生成就像是一個畫家 跟從着你的指示 有意識的從上而下作畫
說實話 我還是有點好奇 4o 圖像生成的技術原理的 期望日後會有更多的技術細節被公開吧
結語
現時 AI 的發展瞬息萬變 各家互相競爭 前浪後浪可說是拼個你死我活 好不容易取得的優勢 轉眼間又被趕過 就連我們這些一般用戶 稍不留神也都變得落後於人
目前這項圖像生成工具只提供給 GPT 的用戶 但依現時的 AI 發現趨勢來看 它的這優勢也很快會被抺平吧
技術難關不停被攻克 發展步伐不停加速 人類自傲的能力變得容易被取代 昔用用於分辦 AI 的方法也變得不再適用
發佈留言