AutoGPT:个人AI的开拓者

自然语言处理技术(NLP)目前正处于爆发时期,许多人已经预测,在不久的将来,我们的电脑将像人一样流畅地交流、理解和生成内容。而在这个领域中,AutoGPT是一个非常重要的分支。

AutoGPT最初在2015年提出,是一个自动化的文本生成框架。该框架基于大型预训练语言模型,并通过微调来适应特定的应用场景。经过多年的发展,它已经成为了生成自然语言文本的主要工具之一。

AutoGPT的核心原理是生成式预训练,该方法通过将大量的文本数据输入到神经网络中,使其学习自然语言的规律。直到最近,这种方法都没有被广泛应用,因为它需要相当高的计算资源和大量的数据。但由于我们掌握了更强大的计算和更多的数据,可以为模型提供更多的输入,因此这种方法越来越受欢迎。

AutoGPT是自动生成式AI的核心:它不需要程序员写下指令,它可以通过模仿人来生成文本、图像和声音。它通过长期记忆实现意义上的自学,能够拓展自己的知识,也能在对话中积累新知。

另外,自动化的文本生成,可以用于缩短编写时间,使得内容创作者可以快速生成大量的高质量文章,这也是AutoGPT备受欢迎的原因之一。

当然,还有其它原因,比如经济效益。因为人工编辑有时是一项十分昂贵的工作,并且需要耗费大量的时间。而AutoGPT可以自动完成,大大减少了成本和时间。

除此之外,AutoGPT对于文化和艺术的表现也非常重要。它可以在很多方面影响人们的生活,例如自动翻译、自动生成歌词、创造走向未来的谈话机器人和游戏角色的随机魔法和技能等等。

AutoGPT最重要的应用领域之一是个人AI。这是一个目前正在兴起的新技术,主要是让普通人也能够拥有自己的“人工智能”,并让这个AI自动为他们提供服务。

在自己的电脑上配置一个AutoGPT的代理客户端,即可实现本地应用程序和自己的AI链接。这样,就可以让AI自动根据自己的需求,自动化地完成各种任务。

这是一项非常有意义的技术,能够拓展人类的思维和想象力,同时也能帮助人们更好地管理生活和工作。尽管AutoGPT的应用领域具有非常广泛的前景,但目前的问题在于其成本比较高。

除此之外,还需注意AutoGPT的法律和道德问题,例如AI是否可以被视为人类,AI与人类之间的关系应该是什么样的等等。这是一个很大的问题,需要我们花费大量的时间和精力来思考和研究。

个人AI是一项拥有无限前景的技术,而AutoGPT则是它的重要开拓者之一。在未来,我们可以预见到AutoGPT将在更多的领域上应用,同时个人AI也将越来越普及化——这将是我们开创的一个全新世界。

————

《AutoGPT:个人AI的开拓者》小节

  • AutoGPT是一个自动化的文本生成框架。
  • AutoGPT的核心原理是生成式预训练。
  • AutoGPT可以用于缩短编写时间,大幅减少成本和时间。
  • AutoGPT可以在很多方面影响人们的生活,例如自动翻译、自动生成歌词、创造谈话机器人和游戏角色的随机魔法和技能等等。
  • 个人AI是一项非常有意义的技术,能够拓展人类的思维和想象力,同时也能帮助人们更好地管理生活和工作。
  • 在未来,我们可以预见到AutoGPT将在更多的领域上应用,同时个人AI也将越来越普及化。

【生成代理人】——史丹福发布AI研究



最近,史丹福大学发布了一份重要的 AI(人工智能)研究报告。

这份报告介绍了“生成代理人”,这种代理人可以模拟出真实的人类行为。

以下是详细内容及其可能带来的灾难性后果:

1/ 推理

“Smallville” 是一款类似于《模拟人生》的游戏世界。

在这个游戏中,有 25 个代理人(角色)生活在里面。

他们的行为方式非常接近于人类。

这些代理人可以:

• 计划他们的每一天
• 分享任何新闻
• 建立关系
• 协调行动

2/ 架构

如何创建生成代理人呢?

你需要一个架构,它通过存储、综合、应用相关的记忆来生成可信的行为。

这可以通过一个大型的语言模型(ChatGPT)来实现。

这个系统有三个核心组成部分。

• 记忆流 —— 记录代理人的经历
• 反思机制 —— 综合记忆以帮助得出结论
• 计划机制 —— 将结论转化为行动计划

3/ 故事

开始模拟。

指派了一个代理人 —— Isabella 负责组织一个情人节聚会。

许多事情都可能出错,这个代理人可能会:

• 不按指示行动
• 忘记告诉其他人
• 忘记自己要参加聚会

接下来会发生什么?

4/ 结果

在模拟结束时,共有 12 个代理人听说了 Isabella 的聚会。

这是没有任何用户干预的结果。

更重要的是,在模拟过程中,代理人社群形成了新的关系。

下图显示了 Isabella 聚会的扩散路径。

5/ 紧急社交行为

接下来的两天,代理人自主地传播聚会的邀请。

他们还:

• 建立了关系
• 协调参加聚会的时间
• 互相邀请去聚会

这些行为是 emergent(自发而非预先编程的)的。

6/ 社会影响

生成代理人可能产生对社会的有害影响:

• 拟人化 —— 人类会把情感附着到代理人上
• 错误影响 —— 代理人做出错误的推断,从而造成伤害
• 生成 AI 风险 —— 自适应防范和深度伪造

从这个实验中可以清楚地看到:

生成代理人为人机交互提供了一个新的视野。

如果我们正视道德关切,我相信自主代理人可以帮助社会推动生产力:从联合驾驶员到沉浸式环境。

更多有关 AI 的内容,请关注我的账号 @thealexbanks。

如果你喜欢这个帖子,请订阅我的新闻通讯,这里会不定期推出 AI 方面的最新资讯:

https://noise.beehiiv.com/subscribe

欢迎大家转发这个帖子以便更多人了解:

https://twitter.com/thealexbanks/status/1646495660664057856

你可以在这里阅读完整的论文:

https://arxiv.org/pdf/2304.03442.pdf

P.S. 下个周末伦敦有一次为期 24 小时的 AI 黑客马拉松比赛。

点击这里报名:

https://lu.ma/w3b9i55s

ChatGPT的生成式游戏代理

过去的模拟类游戏,是玩家作为一个角色深入到游戏的宇宙中,按自己的抉择生存、采集、战斗、开拓、结盟、欺骗、交易、经营,直到完成自己在游戏中的目标。游戏里的NPC(机器管理的配角)是无足轻重的,最多完成指路,提示,交谈这类边缘任务。

ChatGPT的生成式游戏代理

这篇论文开拓了模拟类游戏的一个观念。游戏里的NPC(非人类角色)在ChatGPT的武装之下,不再依赖于外部人类角色而独自生存,他们互相对话,互相沟通。人类仅是一个看客,最多作为一个吟游诗人进入他们的生活,想办法用自然语言、通过对话籁影响和干预它们的游戏宇宙的进化。[1]

原来的模拟游戏、策略游戏、角色扮演游戏都会在新的模式下有新的变种。不再是人类玩家作为角色进入游戏完成自己的目标,而是作为高维角色通过语言干预社会的发展,文明的进步。游戏内部在发展文明,我们作为《苏秦张仪》,《马可波罗》,《老子》,《智子》或者《歌者》去干预或加速游戏中文明的发展。

生成式游戏代理的概念

总之,这种生成式游戏代理的概念,让游戏里面的NPC以一种我们人类可以理解的方式独立存活,互相交往,协同发展。他们的文明进步不依赖于玩家,玩家升级成为一个干预文明的角色。最后游戏玩家比的不是自己的角色成就,而是自己的宇宙总体文明成就。

这个概念不仅仅适用于游戏世界,在真实世界中,我们也可以设想一个生成式代理的世界。在这个世界里,我们不再困在地球的物理约束中,而是在一个由ChatGPT生成的虚拟世界里进行交互。我们可以像玩家一样进入这个世界,也可以像生成式代理一样与世界进行灵活互动。这种生成式游戏代理的概念,可以被广泛应用于人工智能、研究语言等领域,将为我们带来更多的可能性。

结语

ChatGPT的生成式游戏代理,是对游戏规则的一次革命,不再依赖于人类玩家,而是由ChatGPT生成的虚拟世界中的NPC独自生存、互相交流协同发展。这种代理概念不仅仅适用于游戏,也可以推广到更广泛的领域,为我们创造更多的可能性。

参考文献:

[1] https://arxiv.org/pdf/2304.03442.pdf

减少劳动时间的5个技术工具


ScribeHow

写文档和指南曾经需要花费很多时间,但现在不再了!@ScribeHow 创作自动生成的步骤指南,把几个小时的工作缩短到分钟。无论你是单独工作还是团体合作,这都是必备的工具。

👉 https://scribehow.com/redirect?to=https%3A%2F%2Fchrome.google.com%2Fwebstore%2Fdetail%2Fscribe-%E2%80%94-documentation-so%2Fokfkdaglfjjjfefdcppliegebpoegaii%3Futm_source%3Dtwitter&utm_medium=organic&utm_campaign=twitterthread&utm_source=twitter

Notion

项目管理是任何业务、项目或事业的关键方面之一。@NotionHQ 是我去选择的项目管理工具之一。现在Notion有了无限的AI整合到平台上。工作更快,写作更好,思考更大。

👉 https://www.notion.so/ https://twitter.com/ChrisStaud/status/1646398974914355201/video/1

Magic Studio

使用 @MagicStudio 处理图像使工作变得更容易。我发现其中最有用的功能是从图像中删除不需要的对象。

👉 https://magicstudio.com/ https://twitter.com/ChrisStaud/status/1646399028412678144/video/1

Bubble

@bubble 可以提供一些代码或不用代码便能建立SaaS平台、市场及客户关系管理。当测试市场想法或建立MVP时,使用Bubble这样的工具要比开发快得多,更廉价!

👉 https://bubble.io/

Lumen5

一个专门进行视频编辑的AI动力工具 — @LumenFive 可让你看起来像有一个完整的编辑团队支持你一样。他们的拖放界面使整个过程变得简单。他们甚至提供模板来供您开始。

👉 https://lumen5.com/ https://twitter.com/ChrisStaud/status/1646399088470945795/video/1

@LumenFive 如果这个主题帖对您有帮助:

  1. 跟我联系:https://linkedin.com/in/chrisstaudinger/ 获取此类内容。
  2. 关注https://linkedin.com/company/creatoramp 停止发布的日常内容此类内容(即将开始落下🔥)。
  3. 喜欢并转发线程中的第一条推文,与他人分享。

从Chain-of-Thought(CoT)到Let'sth



最近每天都可以看到大语言模型进展的文章,LLM的能力从简单文字的处理,逐步演化到复杂的reasoning推断,甚至可以做decision making来完成api调用及tool的使用。

此条thread回顾了两篇重要的CoT文章作为读书笔记。

Paper 1: Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

此文是CoT的开山之作,作者Jason Wei当时就职于google brain,如今在openAI,同时也是ChatGPT的重要作者。

CoT是解锁LLM 推理能力的重要钥匙,一举开启了挖掘LLM隐藏技能的新的paradigm

在CoT出现之前, LLM的发展遇到了尴尬的瓶颈,模型越来越大,处理文字能力越来越强,但却似乎没有涌现出接近人类的推理能力,包括算术(e.g. 8只鸡4只兔同笼,一共多少只脚),常识(e.g. 鸭梨能漂在水中么?)以及符号(e.g. 抛硬币若干次,到底哪面朝上)的推理。

作者Jason发现,传统的prompting中,总是让模型一步到位地解决一个复杂multi-step问题,而我们人类的认知方式则是分步骤解决复杂推理问题。

所以,他提出了一个简单有效的prompting方法,把人类思考问题的过程,所谓chain of thought,用自然语言的形式,显性的放在prompt message中。

这样以来,prompt的message形式由

<input, output>

转化为:

<input, chain of thought, output>

之前的thread讲过language modeling,而CoT的思想与之呼应。当chain of thought被放在prompt中时,就会强制LLM在给出答案前, 把chain of thought输出。

从条件概率分布的角度来讲,答案在chain of thought后,其准确的可能性更大。

这也反应了一个问题,即LLM或许没有思考,它只在乎输出。

作者经过实验,发现这种简单的prompting方式在超过1000亿的大模型上非常有效,而在小模型上效果不明显。

如果将‘涌现’定义为:

“由量变引起的质变”

那么虽然作者没有直接证明大模型可以推理,但直接证明了经过CoT, 大模型的推理能力可以被解锁,并且这种能力在超过1000亿的超大模型上得以涌现。

题外话,ChatGPT一种涌现的工具,其强大的涌现能力与作者Jason有直接的联系,我们有理由怀疑,不开源的ChatGPT下,或针对用户的输入和任务,有着隐含的CoT,来引导大模型获得更加突出的表现。

Paper 1 链接:https://arxiv.org/abs/2201.11903

Paper 2: Large Language Models are Zero-Shot Reasoners

Jason的文章中,所用的CoT是手动设计的,所以隶属于few-shot-CoT, 需要一定的人工成本。

此文作者小岛武,进一步简化了CoT的过程,简单的将 ‘Let’s think step by step’ 放进prompt message, 让LLM自动生成CoT, 所谓的zero-shot-CoT.

‘Let’s think step by step’这句神奇的话,仿佛咒语,将解锁LLM的能力的过程一步简化!

具体来说,完成逻辑推理任务,只需要两步:

  1. 念咒语‘Let’s think step by step’, 生成CoT
    2)将CoT再此嵌入prompt message,完成任务。

下面给出一个在 @LangChainAI 中使用 chain-of-thought 来完成SQL query generation的例子

Paper 2 链接:https://arxiv.org/abs/2205.11916

下一个thread,将记录用CoT完成api和工具使用的paper读书笔记,如果你喜欢我的读书笔记,请关注我 @realrenmin ,每周会写一到两个长thread跟大家分享NLP的知识。

从AutoGPT谈起,看大语言模型使用工具的发展



引言

近来,AutoGPT成为了推特上最热点的话题之一。其目的是借助外部工具(例如Google)协助大型语言模型完成复杂任务,这早已是我最近研究的论文主题之一。

本文通过分析AutoGPT源码,讨论其局限性,并简要概述几篇论文,探究大型语言模型使用工具的发展。

深入了解AutoGPT

抛开其华丽的演示,AutoGPT最核心的代码是prompt message的构建方式:

即将用户输入的ai name/role/goals直接合并到默认的prompt message中,其本质在于prompting。

代码如下:

构建完整的prompt message:

1
https://github.com/Torantulino/Auto-GPT/blob/master/scripts/ai_config.py

默认prompt message:

1
https://github.com/Torantulino/Auto-GPT/blob/master/scripts/prompt.py

详细解析prompt message

值得注意的是,通过constraints和performance evaluations要求llm使用缓存,并强行要求输出JSON格式,键值包含了所谓的reasoning和planning,以及选中的command API。

这里所说的reasoning引起了我的注意,它真的有进行推理吗?

回顾之前的CoT和ReAct的读者肯定明白,大型语言模型的推理(reasoning)是一种涌现行为,具体指:
只有在引入CoT之后,超过1000亿参数的大型模型才能解锁reasoning能力。

确切地说,AutoGPT的prompting方式没有显式引入CoT,因此并没有解锁reasoning能力。因此,它只能严重依赖缓存做desicion making,一遍遍地重复action,有勇无谋。在以token计费的情况下,这种局限性被放大,具有炫酷的外表,却让一般开发者望而却步。

大型语言模型使用工具的发展

随着模型越来越大,大型模型的应用方式也在不断地变化:

  1. 在fine-tuning或人工反馈强化学习方面的成本越来越高;
  2. 模型的涌现能力让zero-shot/few-shot成为了潮流。

在这一潮流中,CoT和ReAct 扮演了极其重要的角色。它们解锁了模型涌现推理能力,帮助语言模型挖掘自身潜在的知识,改变了模型应用的界限。ReAct迈向了大型模型在外部工具上的应用,并弥补了大型模型在预训练知识方面的局限。MM-ReAct使语言模型超越语言文字的范围,进一步拓展了其应用边界。

总结

Autogpt的prompting方法本质上是可以改进的,将CoT引入其中,将大大提升其性能。

如果你喜欢我的读书笔记,请关注@realrenmin。最近的感受是每一次的thread仿佛在写一篇小的综述,这个过程让我和我的读者都受益匪浅。如有任何疑问和错误,请指出,大家共同讨论,一起成长。

PeopleareAlreadyDoingIncredibl


AutoGPT是一项强大的人工智能技术,其自动文本生成和问题回答功能已经帮助人们快速解决各种任务。自AutoGPT推出以来,已经有很多有趣的应用例子被分享了出来。让我们看看一些最令人惊叹的用例是什么!

GPT-4代理自动完成任务

Garrett Scott在Twitter上分享了他使用AutoGPT生成一个GPT-4代理来完成添加到待办事项列表中的任务的案例。仅仅通过将任务添加到列表中,代理就能快速地生成合适的解决方案。这是一种强大的工具,可以帮助人们在任何时候处理重要的任务。

市场研究

Sully Omarr在Twitter上分享了他使用AutoGPT进行市场研究的案例。他利用AutoGPT来生成市场报告,帮助他更好地了解市场和客户需求。这种方式比传统的市场研究更加高效,也更容易理解。

变革您的业务

Nathan Lands在Twitter上分享了他使用AutoGPT改变业务的案例。他使用AutoGPT来自动化各种业务流程,减少了许多重复性任务,极大地提高了效率。这种技术的高效性和自动化能力,可以为任何企业带来巨大的好处。

创建应用程序

Varun Mayya在Twitter上分享了他使用AutoGPT创建应用程序、安装缺少的软件包和查找相关链接的案例。这种功能可以节省人工编写代码的时间。有了这个工具,创建应用程序将变得更加轻松快捷。

浏览最近的事件和创建播客大纲

James Baker在Twitter上分享了他使用AutoGPT来浏览最近的事件和创建播客大纲的案例。利用AutoGPT,他可以迅速了解最新的新闻和事件,并准确地构建一个详细的播客大纲,从而提高了效率和准确性。

初学者指南

如果你想了解AI技术,那么这本初学者指南非常适合你。这本指南包含了ChatGPT的使用方法、Prompt Writing技巧、初学者提示等内容。这些内容可以帮助你更好地理解AI技术,并帮助你快速上手使用。

自动预定机票

Barsee在Twitter上分享了他使用AutoGPT浏览航班信息并自动预订机票的案例。这种快捷的方法可以帮助人们省去排队等待预订机票的时间,使旅行更加高效。

社交媒体和财务建议和客户服务

Greg Isenberg在Twitter上分享了他使用AutoGPT进行社交媒体、财务建议和客户服务的案例。这种方法可以快速生成符合要求的文本内容,从而减少大量的时间和人力成本。

成为更好的企业家

Ethan Mollick在Twitter上分享了他使用AutoGPT来成为更好的企业家的案例。他利用AutoGPT来为自己制定更加详细和具体的商业计划,并提高了自己的经营管理能力。这种方法可以帮助人们更好地了解自己的商业需求,并提供可行的解决方案。

在iPhone上使用AutoGPT

Nathan Chan在Twitter上分享了他在iPhone上使用AutoGPT的案例。使用这种方法可以方便地处理各种任务,并快速地生成文本内容。

最后,让我们看看OpenAI的Andrej对AutoGPT的评价。

这些令人惊叹的案例仅仅是AutoGPT的冰山一角,这种技术有着广阔的应用前景,可以自动处理各种任务。如果你也有令人惊叹的用例,欢迎分享给我们。

今天亚马逊(Amazon)、稳定AI(StabilityAI



以下是发生了什么以及如何理解它们:

1.通过AWS实现基石(Bedrock)

  • 基石使企业能够使用和微调基础模型与自己的数据。

  • 来自Anthropic、AI21(欧洲语言)、Amazon Titan(新语言模型)和稳定AI(图像)的基础模型。

这加入了企业领域中NVIDIA、Scale、OpenAI和Microsoft的其他产品。

每个人都认识到企业将微调自己的模型,并且需要在不泄露数据的情况下完成。

亚马逊/Scale提供多个模型。

OpenAI/MSFT使用OpenAI。

NVIDIA不明确,但很可能也是多个模型。

这就是Anthropic等人可以获得分销的方式。

关于这个推出的最有趣的部分是官网非常混乱:https://aws.amazon.com/bedrock/

正如这个评论所说的:

2.亚马逊发布CodeWhisperer

  • 这是亚马逊的GitHub Copilot版本
  • 个人开发者免费
  • 开发人员似乎更喜欢Copilot

访问:https://aws.amazon.com/codewhisperer/

总体而言,这是亚马逊的有趣的一天。

我会参加公司的财报电话会议,看看他们如何谈论人工智能。

2个月前,亚马逊甚至没有提到人工智能:https://twitter.com/tanayj/status/1622385080424357889

3.稳定AI发布SDXL

这是Stable Diffusion的下一步发展。

  • 似乎更接近于Midjourney的质量
  • 随着时间的推移,将成为开源项目

访问:https://beta.dreamstudio.ai/generate

值得注意的是,SDXL更擅长生成更清晰的文本。

下面是TechCrunch的一次尝试:

在文本方面,我们真的在等待能够很好地完成这项工作的DeepFloyd IF。

似乎即将推出。

https://twitter.com/deepfloydai/status/1617000612004069376

4.谷歌向选择的医疗保健客户发布Med-PaLM 2

大约一个月前,谷歌宣布了Med-PaLM 2的巨大成果:

https://twitter.com/AziziShekoofeh/status/1635669966363021315

5.Meta开源“动画绘图”

  • 该项目将手绘图形带入了生活
  • 这是自2021年开始发布该项目并从公众收集数据以来的持续努力

访问:https://github.com/facebookresearch/AnimatedDrawings https://twitter.com/nonmayorpete/status/1646619389633138688/video/1

喜欢这篇文章吗?

您会喜欢我们的新闻稿,其中我们为46K+的商业专业人士拆分了AI:

https://join.theneurondaily.com/

Chrome浏览器插件让你比其他人更快!



  1. Scribe

只需记录你的屏幕,Scribe将自动将其转换为逐步过程。

非常有帮助的功能:

• 培训新员工

• 构建培训材料

• 为客户提供帮助等等

🔗 https://scribehow.com/redirect?to=https%3A%2F%2Fchrome.google.com%2Fwebstore%2Fdetail%2Fscribe-%E2%80%94-documentation-so%2Fokfkdaglfjjjfefdcppliegebpoegaii%3Futm_source%3Dtwitter&utm_medium=organic&utm_campaign=twitterthread&utm_source=twitter

  1. ChatGPT提示神器

不要为所有事情都使用ChatGPT!

• 发现、分享、导入、使用最佳提示。

• 保存你的聊天记录。

🔗 https://chrome.google.com/webstore/detail/chatgpt-prompt-genius/jjdnakkfjnnbbckhifcfchagnpofjffo?hl=en

  1. Compose AI

让你的写作效率提高40%。

• 撰写任何内容

• 改写句子

• 自动完成

• 撰写电子邮件

🔗 https://www.compose.ai/

  1. ChatGPT for Google

很难说ChatGPT是否会取代Google搜索。

在搜索引擎结果旁显示ChatGPT响应。

🔗 https://chatgpt4google.com/

  1. 使用ChatGPT进行YouTube摘要

使用ChatGPT对YouTube视频进行摘要。

🔗 https://glasp.co/

StableDiffusionContorlNet1.1更新



StableDiffusion最强大的插件ContorlNet 1.1更新说明

近日,StableDiffusion最强大的插件ContorlNet迎来了更新,这是一个极其重要的版本,旧模型增加了大量数据进行了重新训练,还新增了几个模型,它的模型总数达到了14个,新增了4个模型,对于使用者来说呢,可能会给SD带来新的玩法。下面是具体的更新内容:

更改了模型命名规则

从 ControlNet 1.1 开始,我们重新调整了模型命名规则,开始使用标准的命名方式。以前的模型名称由于使用了部分不规范的缩写方法,难以表达出模型的真实含义。而新的方式能更好地定义模型名称。

更新了数据集

新版本的 ControlNet 使用的数据集是与旧版本不同的。许多用户反馈旧数据集的模型并不是很优秀,有时候表现也很糟糕。所以,我们在新版本中重新训练了这些模型,采集了更多的数据,使得模型的表现更加出色,对于用户而言,使用效果将更好。

新增了4个模型

其中新增的4个模型均采用了新的数据集进行了重新训练,旧的数据集则用于训练旧的模型。新增的4个模型其实也是针对用户的反馈与需求进行了开发。这些新增的模型涵盖了更多领域,如目标跟踪、图像分割等,这将满足不同用户的使用需求。具体来讲,这四个模型是:

  • 视频超分辨率判别模型
  • 科研识别模型
  • 卫星摄像头目标跟踪模型
  • 图像语义分割模型

其它新特性

在新版本中,我们还针对旧特性做了一些小优化,使其在表现与使用上更加优秀。以下是一些具体的特性:

  • 修复了一些已知的问题
  • 优化了算法,提升了速度和性能
  • 更好的可扩展性,可以更轻松地添加更多的模型
  • 数据集现在可以直接使用 URL 进行访问,便于分享与使用

总体而言,这个版本的更新对于用户而言意义重大。虽然这个版本较为普通,但是我们相信,这个版本肯定将会给使用者带来更加出色的体验。

更多信息请参考官方网站:https://www.stablediffusion.com

注意:上述更新内容翻译均非官方翻译,如有误,请以官方决定为准。