阿里巴巴旗下的通义系列包含多款 AI 大模型,如通义千问(语言模型)、通义万相(艺术创作模型)、通义听悟(音视频模型)和通义智文(AI 阅读助手),它们在多个领域如电商、设计、对话和法律分析中发挥着重要作用。
平时工作生活中使用的较多的是通义千问、通义万相、通义听悟、通义智文几种,帮助我获取整理专业知识,获取灵感以及快速阅读:
通义千问:多模态 AI 大模型
界面体验:
通义千问拥有简洁而一致的页面布局,提供沉浸式的问答体验。界面无过多修饰,专注于核心功能,使用户更易于集中注意力在问题与回答上。
使用感受:
在语义理解和答案准确度方面,通义千问表现优异,尤其在处理千字以内的查询时,回答流畅且无明显间断。
通义万相:AI 艺术创作模型
万相的界面以深色模式为主,突出了图片生成区域,同时提供了关键词选项,便于用户快速进行创作。
虽然在人物图像创作方面表现较好,但在抽象图标和文本引导的图片生成方面仍有提升空间。图片细节处理方面也存在一定的挑战。
通义听悟
一个非常好的在线会议、视频学习、播客学习等音视频转文字并且整理以及摘要的平台。
听悟的界面设计强调智能感,功能入口明确,降低了用户学习成本。其功能覆盖了视频转录、实时解析等多种场景。
实时记录场景:语音识别以及文本转录的内容准确度挺高,较为嘈杂的场景也能比较准确的识别文字 ;
视频场景:能够提取摘要,并且能区分讲话人进行总结,以及生成 PPT 且定位,但是 PPT 仅仅是截取视频的整个画面;
播客场景:暂不支持摘要提取,只能复制文本内容,需要自行加工;
通义智文:一个文档电子书籍快速整理阅读的 AI 平台
智文的界面简约,主要聚焦于阅读体验。
阅读场景覆盖全面,对于电子书籍,智文能够提供准确的全文摘要和章节总结,极大地提高了阅读效率。(移动端推荐 “ Cubox ” 对于间断的公众号、网页文章体验不错,就是需要付费体验摘要、问答等 AI 能力)
三、天工 AI
(, 下载次数: 2)
上传
点击文件名下载附件
天工 AI 是由奇点智源和昆仑万维联合开发的一款综合型大模型平台,它集成了搜索、对话和创作等多种功能。
界面体验:
天工 AI 采用了浏览器式的界面布局,这种设计贴合了产品的功能定位。然而,其背景设计较为复杂,可能会对用户造成视觉疲劳。
功能入口清晰,便于新用户快速熟悉并使用各项功能。
使用感受:
在回答问题方面,天工 AI 展现出了较高的答案完整性。它能够结合全网搜索,提炼并展示相关的新闻资讯链接,这不仅提高了回答的可信度,也增强了专业性。
答案生成过程中,天工 AI 能够准确标注信息来源,这是其一个突出的特点,帮助用户理解答案的依据。
天工 AI 在处理各类信息时表现出色,能够快速匹配并提供丰富的背景资料,满足用户的多元化需求。
四、kimi
(, 下载次数: 1)
上传
点击文件名下载附件
Kimi Chat 是 Moonshot AI 推出的一款功能丰富的工具,专注于整理资料、处理文件和提供快速网址访问。它在简化日常工作流程方面展现出了显著的优势。
界面体验:
Kimi Chat 采用了简洁而清晰的界面设计,以浏览器形式呈现,为用户提供了舒适和直观的使用体验。
背景设计干净且现代,这不仅降低了视觉干扰,也增加了用户操作的便捷性。
使用感受:
Kimi Chat 在速读新闻和总结文章方面表现突出。它能够快速解析和归纳大量信息,极大地提高了工作效率。
与天工 AI 相似,Kimi Chat 在回答问题时会联网搜索相关新闻资讯,尽管它在信息来源的广度上不如天工 AI 全面,但在文章链接和电子书籍的快速解析上则表现更为出色。
综合来看,Kimi Chat 在快速处理和总结大量文本资料方面具有明显优势,尤其适合于快节奏的工作环境。
五、文心一言
讯飞星火是科大讯飞推出的新一代认知智能大模型,它凭借其跨领域的知识库和语言理解能力,为用户提供自然对话方式的任务理解和执行。这一模型不断从海量数据中学习,致力于解决问题的全流程闭环,从提出问题到规划解决方案。
界面体验:
讯飞星火的界面设计遵循了 AI 大模型的常规布局,提供了沉浸式的问答体验。界面简洁,无过多修饰,便于用户专注于与模型的交互。
使用感受:
虽然在专业知识方面的表现略显不足,但其在逻辑推理、解题和写作等教育相关领域表现出色。
在实际应用中,讯飞星火特别适合于教育和学习场景,其对问题的理解和答案的提供都表现得十分专业。
七、智普清言
(, 下载次数: 1)
上传
点击文件名下载附件
智普清言,由智谱 AI 公司在 2023 年训练的 GLM-4 语言模型,是一款基于深度学习技术的自然语言处理模型。通过学习大量文本数据,它能够理解和生成自然语言,针对用户问题和需求提供适当的答复和支持。
界面体验:
智普清言的界面遵循 AI 大模型的常规布局,提供沉浸式问答体验。界面设计集中在功能性和易用性,助于用户快速理解并使用各项功能。
智普清言特别增加了功能入口和灵感大全,提升了操作便利性,使用户易于接触和探索更多功能。
使用感受:
在处理一些专业或深层次问题时,表现有较大的惊喜,其回答的准确性和深度表现不错。
智普清言在生成式的回答方面也表现不俗,可以生成较为流畅和通顺的回答。
智普清言在回答完成之后还会根据历史提问智能推荐相关问题或知识,帮助用户更加深入了解。
智普清言还能自己定制智能助手,并且按照自己的专业喜好进行训练,帮助用户更好的完成专业工作或者处理生活事项。
八、Gemini
(, 下载次数: 0)
上传
点击文件名下载附件
Gemini 是 Google 推出的原生多模态大模型,Google 称 Gemini 是其历史上最强大、最通用的模型,在许多基准测试中都具有最先进的性能。Google DeepMind 的 CEO Demis Hassabis 称 Gemini 可以像人类一样理解我们周围的世界,并吸收任何类型的输入和输出,包括文本、代码、视频、音频和图像。Gemini 模型从大到小分为 Ultra,Pro,Nano 三个版本。其中 Pro 版本已经整合到谷歌的 Bard 平台中,但目前仅支持英文地区的用户使用。
界面体验:
Gemini 的界面设计紧随其功能多样性,呈现出极简风格,便于用户专注于与模型的互动。
虽然在模型能力介绍方面的信息不如其他平台详尽,略增加了用户学习成本,但整体上为用户提供了清晰、直观的交互体验。
使用感受:
Gemini 背靠 Google 强大的搜索引擎,特别在基于网络搜索的问题处理方面表现出色。它能够整合网络资源,提供全面、多样的答案。
对于专业性较高的问题,Gemini 的表现尚有提升空间,可能与语言处理能力相关。在答案的完整性和专业度方面相比通义千问有所不足。
总体来看,Gemini 在多模态处理和网络资源整合方面展现了显著的优势,尤其适合处理需要广泛信息整合的查询。
九、Claude
(, 下载次数: 0)
上传
点击文件名下载附件
Claude 是 Anthropic 开发的一款人工智能聊天机器人,Claude 可以理解自然语言并生成相应的回复 , 和人类进行基本的对话与交流,相比其他大模型语言更加人性化,Claude 具有一定的情感理解能力 , 可以从对话中解析出对方的情绪变化和态度 , 并在一定程度上调整自己的回应语气。Claude 的知识和理解能力还比较有限,它更类似于一个知识图谱 + 搜索引擎 , 可以在已有知识上快速匹配和检索信息 , 但还无法进行复杂的推理或深入分析。
界面体验:
Claude 的界面设计保持了简约风格,便于用户进行流畅的交互。这种设计虽不复杂,但却充分满足了与 AI 进行自然对话的需求。
用户界面注重功能性和易用性,使得即使是初次接触的用户也能快速上手。
使用感受:
Claude 在自然语言处理方面表现出色,尤其是在理解用户输入和生成人性化回应方面具有显著优势。
尽管知识和分析能力相对有限,它更像是结合了知识图谱和搜索引擎的工具,能在已有知识范围内快速匹配和检索信息。
在实际使用中,Claude 尤其适合于需要情感理解和基本信息检索的场景,提供了友好和自然的交流体验。
十、Perplexity AI
(, 下载次数: 2)
上传
点击文件名下载附件
Perplexity AI 是一个先进的 AI 工具,专注于提供深入的、以问题为中心的搜索和分析。它通过理解和分析用户的查询,提供相关和深度的答案,不仅仅是传统搜索引擎的结果列表。
界面体验:
Perplexity AI 的界面简约,突出搜索功能,减少了视觉干扰,使用户更易于专注于搜索任务。
所有功能都是直观的,提升易用性。
使用感受:
整个搜索和获取答案的流程是流畅的,响应时间非常迅速,即使是复杂查询也能迅速回应。用户从提出问题到得到答案的体验是无缝的。
Perplexity AI 在提供深度、有针对性的搜索结果方面表现出色,但是,它在理解一些极其复杂或模糊的查询方面仍有提升空间。
十一、Poe
(, 下载次数: 0)
上传
点击文件名下载附件
Poe(Platform for Open Exploration)是由 Quora 开发的一个人工智能聊天机器人平台。这个平台汇集了多种 AI 聊天机器人,如 ChatGPT、Sage、Dragonfly 和 Claude,使用户能够与它们进行互动并获取信息。
界面体验:
Poe 的界面设计契合自身功能定位,充分考虑到用户导航需求,旨在减少用户的认知负担,使用户能够迅速开始与 AI 的互动。
Poe 的阅读体验不佳,文字内容的字号以及行间距不太合理,使得文本过于密集,阅读舒适性过低。
使用感受:
Poe 展现了一定程度的个性化,用户可以根据自己的需求,选择相应的 AI 助手或者自定义 AI 机器人进行对话。
Poe 的语音识别技术非常先进,可以准确识别用户的语音指令,并进行相应的回复,但是在语义理解方面有待提高。
十二、豆包
AI 工具“豆包”是由抖音集团推出的一款免费的智能对话和创作助手。它基于云雀大模型,可以实现文本生成、图像生成、语音交互等多种功能。
界面体验:
豆包的界面设计简洁且直观,没有过多的繁琐元素,让人一目了然。
导航清晰明确,新用户也能快速上手,降低学习成本。
使用感受:
在学习场景、辅助阅读方面表现出色,能快速响应,并流畅生成答案,但是在语义理解以及知识库的广度略显不足。
左侧导航栏提供了更加专业的“智能体”,用户可以选择其进行定向、专业的解决问题,主要是学习、写作、情感聊天方面表现出色。
十三、PopAI