吴恩达的2022年终盘点生成式AIVi - 投资艺术

TUhjnbcbe - 2025/5/29 20:08:00

白癜风的治疗 https://m.39.net/disease/a_5419408.html

近日，吴恩达在圣诞节的《TheBatch》特刊上发布了一年一度的年终盘点。在过去的一年，生成式AI迎来爆发式增长，由人工智能生成的图片在社交平台疯狂传播，引发大量争议的同时也推动了投资；视觉Transformer(ViT)的工作也出现爆炸性增长，在过去一年中，研究人员共计发表超过17,篇ViT论文；AlphaCode、Codex等的推出便利了开发者，大受欢迎；与此同时，研究人员也在不断拓宽语言模型的边界，在解决可信度、偏见和实时性等问题方面做出持续不断的努力。

亲爱的朋友们:

随着寒假的临近，我突然想到，我们不是在面对人工智能的冬天，而是在一个人工智能炙热的夏天。

今天，人工智能创造的绝大多数经济价值都来自监督式学习工具，经过训练能够生成简短的标签(如判断垃圾邮件/非垃圾邮件)或一系列标签(如一段音频的文本）。今年，建立在监督式学习之上的生成式成为第二个主要工具，使人工智能能够生成复杂且引人注目的图像或文本段落。

以往开发重要新工具（例如强化学习）的一些尝试，尚未取得与其铺天盖地的宣传相称的成果。但是生成式AI做得很好，它为人工智能应用创造了一个新的范式。

而且监督学习还远远没有发挥出它的全部潜力！依靠监督学习，仍然有数以百万计的的应用有待开发。许多团队仍然在试图找出通过监督学习开发产品的最佳实践。

未来，我期待着继续与生成式AI共舞，为每个人创造大量的价值。我感到很幸运能活在这个时代，科技飞速发展，我们有机会一起创造未来！能与我的家人和你们分享这个世界，我感到倍加幸运。

节日快乐，

Andrew

：人工智能闪耀的一年

节日将近，人们也许正一边手捧着一杯热可可，一边催促ChatGPT建议节日礼物。这个特殊的时刻，让我们回顾这一年人工智能所取得的巨大进步。能够生成类人的文本、图像和代码的系统（视频和音乐也即将推出）让用户倍感惊喜，尽管有人对创造力的未来提出了质疑。

这一年，解码化学和物理学的模型推动了科学发现，同时政府则采取行动推动专用微处理器的供应，使这种创新成为可能。这些科技发展让我们震惊的同时，在这期《TheBatch》特刊中，我们将着重回顾人工智能在年创造的奇迹。

合成图像遍天下

由人工智能制作的图片像病毒一样开始疯狂传播，引发了争议，推动了投资。

大事件:新一代的文生图工具激发了大量的实验，将文本描述转化为迷人的艺术作品和照片，引发超现实主义的幻想。商业企业迅速将这项技术投入使用，使图像生成成为创建和编辑图形软件的必备功能。

背后的驱动力：由于友好的用户界面、具有高度娱乐性的输出以及开放的API和模型，能够生成文字和图像的模型成为人工智能的公众名片。

OpenAI在四月份推出了DALL-E2。超过万用户测试了这个模型，今年9月，公司将它推向了市场。微软为OpenAI提供资金，以换取其作品的独家商业版权，并将该模式整合到AzureAI-as-a-service平台中。

7月，只需操作按钮的艺术家们用简单的Craiyon制作的相对粗糙的图片，这些图片在社交平台上随处可见。

StabilityAI很快就加大了赌注，推出了开源的扩散模型（StableDiffusion），最终吸引了超过1亿美元的新资金。扩散模型于去年11月升级到2.0版。

Adobe、GettyImages和Shutterstock将图像生成模型集成到他们自己的产品和服务中。

这些应用根据给出的文本提示（prompt）会产生截然不同的结果。PromptBase为生成有趣输出的文本字符串打开了一个市场。

缺点：这样的模特是在从网上搜刮来的图像上训练的。像大型语言模型一样，他们继承了嵌入在网络内容中的偏见，可能会模仿煽动性的表达风格。

LensaAI是一款照片编辑应用程序，可以根据用户的自拍生成艺术化身，它登上了app商店排行榜的榜首。它的成功带来了一定程度的争议，因为用户，尤其是女性，发现这个app使她们的图片变得更加性感。

视觉艺术家在线社区ArtStation推出了自己的“文字到图像”功能。许多艺术家感到受到电脑程序的威胁，这些程序可以在几秒钟内复制艺术家来之不易的个人风格，因此开始抵制该网站。

新闻背后:扩散模型经过一系列步骤有选择地去噪来产生输出。加州大学伯克利分校和斯坦福大学的研究人员于年引入了这一技术（