投资艺术

首页 » 常识 » 问答 » 吴恩达的2022年终盘点生成式AIVi
TUhjnbcbe - 2025/5/29 20:08:00
白癜风的治疗 https://m.39.net/disease/a_5419408.html

近日,吴恩达在圣诞节的《TheBatch》特刊上发布了一年一度的年终盘点。在过去的一年,生成式AI迎来爆发式增长,由人工智能生成的图片在社交平台疯狂传播,引发大量争议的同时也推动了投资;视觉Transformer(ViT)的工作也出现爆炸性增长,在过去一年中,研究人员共计发表超过17,篇ViT论文;AlphaCode、Codex等的推出便利了开发者,大受欢迎;与此同时,研究人员也在不断拓宽语言模型的边界,在解决可信度、偏见和实时性等问题方面做出持续不断的努力。

亲爱的朋友们:

随着寒假的临近,我突然想到,我们不是在面对人工智能的冬天,而是在一个人工智能炙热的夏天。

今天,人工智能创造的绝大多数经济价值都来自监督式学习工具,经过训练能够生成简短的标签(如判断垃圾邮件/非垃圾邮件)或一系列标签(如一段音频的文本)。今年,建立在监督式学习之上的生成式成为第二个主要工具,使人工智能能够生成复杂且引人注目的图像或文本段落。

以往开发重要新工具(例如强化学习)的一些尝试,尚未取得与其铺天盖地的宣传相称的成果。但是生成式AI做得很好,它为人工智能应用创造了一个新的范式。

而且监督学习还远远没有发挥出它的全部潜力!依靠监督学习,仍然有数以百万计的的应用有待开发。许多团队仍然在试图找出通过监督学习开发产品的最佳实践。

未来,我期待着继续与生成式AI共舞,为每个人创造大量的价值。我感到很幸运能活在这个时代,科技飞速发展,我们有机会一起创造未来!能与我的家人和你们分享这个世界,我感到倍加幸运。

节日快乐,

Andrew

01

:人工智能闪耀的一年

节日将近,人们也许正一边手捧着一杯热可可,一边催促ChatGPT建议节日礼物。这个特殊的时刻,让我们回顾这一年人工智能所取得的巨大进步。能够生成类人的文本、图像和代码的系统(视频和音乐也即将推出)让用户倍感惊喜,尽管有人对创造力的未来提出了质疑。

这一年,解码化学和物理学的模型推动了科学发现,同时政府则采取行动推动专用微处理器的供应,使这种创新成为可能。这些科技发展让我们震惊的同时,在这期《TheBatch》特刊中,我们将着重回顾人工智能在年创造的奇迹。

02

合成图像遍天下

由人工智能制作的图片像病毒一样开始疯狂传播,引发了争议,推动了投资。

大事件:新一代的文生图工具激发了大量的实验,将文本描述转化为迷人的艺术作品和照片,引发超现实主义的幻想。商业企业迅速将这项技术投入使用,使图像生成成为创建和编辑图形软件的必备功能。

背后的驱动力:由于友好的用户界面、具有高度娱乐性的输出以及开放的API和模型,能够生成文字和图像的模型成为人工智能的公众名片。

OpenAI在四月份推出了DALL-E2。超过万用户测试了这个模型,今年9月,公司将它推向了市场。微软为OpenAI提供资金,以换取其作品的独家商业版权,并将该模式整合到AzureAI-as-a-service平台中。

7月,只需操作按钮的艺术家们用简单的Craiyon制作的相对粗糙的图片,这些图片在社交平台上随处可见。

StabilityAI很快就加大了赌注,推出了开源的扩散模型(StableDiffusion),最终吸引了超过1亿美元的新资金。扩散模型于去年11月升级到2.0版。

Adobe、GettyImages和Shutterstock将图像生成模型集成到他们自己的产品和服务中。

这些应用根据给出的文本提示(prompt)会产生截然不同的结果。PromptBase为生成有趣输出的文本字符串打开了一个市场。

缺点:这样的模特是在从网上搜刮来的图像上训练的。像大型语言模型一样,他们继承了嵌入在网络内容中的偏见,可能会模仿煽动性的表达风格。

LensaAI是一款照片编辑应用程序,可以根据用户的自拍生成艺术化身,它登上了app商店排行榜的榜首。它的成功带来了一定程度的争议,因为用户,尤其是女性,发现这个app使她们的图片变得更加性感。

视觉艺术家在线社区ArtStation推出了自己的“文字到图像”功能。许多艺术家感到受到电脑程序的威胁,这些程序可以在几秒钟内复制艺术家来之不易的个人风格,因此开始抵制该网站。

新闻背后:扩散模型经过一系列步骤有选择地去噪来产生输出。加州大学伯克利分校和斯坦福大学的研究人员于年引入了这一技术(

1
查看完整版本: 吴恩达的2022年终盘点生成式AIVi