为了快速改进你的AI应用，Claude推出提示词Playground

r22201469 2024-12-11 21:33:00 显示全部楼层阅读模式

过去一年来，提示词工程已经成为AI行业内的新兴热门岗位，而Anthropic则有意开发工具将它推向自动化——或者说，至少是一部分自动化。

为了快速改进你的AI应用，Claude推出提示词Playground-1.jpg

根据Anthropic的博客文章，它在本周二公布了多项新功能，以帮助开发人员使用它的大语言模型Claude创建出更具实用性的应用程序。开发人员现在可以使用Claude 3.5 Sonnet来生成、测试和评估提示词，使用提示词工程技术进一步优化输入内容，从而改进Claude在特定任务上的回答质量。
当我们要求语言模型执行某些任务时，它对于输入内容一般比较宽容，但有时对提示措辞的微小变更则可能大大提升输出结果的质量表现。以往我们必须亲自调试措辞，或者聘请提示词工程师专门负责此事，但这次公布的新功能提供快速反馈、能帮助用户轻松找到符合预期的改进方向。
这些功能就旋转在Anthropic控制台的新增Evaluate评估选项卡下。控制台是该公司专门为开发人员提供的测试平台，旨在吸引更多企业客户使用Claude构建产品。其中一项功能正是Anthropic内置的提示词生成器，已经于今年5月推出。这款生成器利用Anthropic内部原研的提示词工程技术，可对任务做出简短描述，也可构建出更长、更详尽的提示内容。虽然Anthropic的工具可能还无法彻底取代提示词工程师，但该公司表示它有助于降低新用户的上手门槛，也能为经验丰富的提示词工程师们节约时间。
在评估选项卡中，开发人员可以测试自己的AI应用提示词在各类场景下的实际效果。开发人员可以将真实示例上传至该测试套件，也可以要求Claude提供一系列由AI生成的测试用例。之后，开发人员可以直接比较各类提示词的有效性，并以五分制对示例答案进行评分。

为了快速改进你的AI应用，Claude推出提示词Playground-2.jpg

为了快速改进你的AI应用，Claude推出提示词Playground-2.jpg

Anthropic在文章中列举的示例中，开发人员发现自己的应用程序在多个测试用例中都存在答案长度太短的问题。开发人员只需调整提示词中的一行就能扩展答案长度，并将它同时应用于所有测试用例。这无疑将为开发人员节省大量时间和精力，特别是那些几乎或者完全不具备提示词工程经验的开发人员。
Anthropic公司CEO兼联合创始人Dario Amodei在今年早些时候在Google Cloud Next大会上接受采访时表示，提示词工程是企业广泛采用生成式AI的关键因素、甚至说前提之一。Amodei总结称：“这事看似简单，但让专业提示词工程师上手30分钟，往往可以决定一种应用到底能不能顺利运行、达成目标。”

使用道具举报

返回列表发表新帖

说点什么

HOT • 推荐

如何用AI自动编写PLC程序?(此文价值巨大)

sophia1评论1 小时前

如何用AI自动编写PLC程序?(此文价值巨大) ...
以后人工智能都会自己编程了,还学编程有用吗?

v166660161评论1 小时前

以后人工智能都会自己编程了,还学编程有用吗? ...
编程ai哪个靠谱

e7i2rv1n1评论1 小时前

编程ai哪个靠谱 ...
MacBook 屏幕进液体，更换背光，维修完成

上海秘书0评论7 小时前

来源：麦克雷维修案例 | 2026-03-22 图片来源：麦克雷现场实拍这台 MacBook 送修时的核心 ...
苹果Apple Arcade 界面曝光,你愿意花多少钱订阅游戏平

Attalea1评论11 小时前

苹果Apple Arcade 界面曝光,你愿意花多少钱订阅游戏平台呢? ...
「Apple Arcade」苹果的游戏订阅服务今秋上线,支持 Ma

sunenwei1评论11 小时前

「Apple Arcade」苹果的游戏订阅服务今秋上线,支持 Mac/iPhone/iPad... ...
推荐3款免费的AI搜索神器

oiyisqprgimp1评论15 小时前

推荐3款免费的AI搜索神器 ...
MacBook Pro 16寸电池鼓包，更换电池

上海秘书0评论昨天 18:39

MacBook Pro 16寸电池鼓包，更换电池来源：麦克雷维修案例 | 2026-03-21 图片来源： ...
ChatGPT是来抢饭碗还是帮助我们提高生产力的呢?

nichol971评论昨天 11:15

ChatGPT是来抢饭碗还是帮助我们提高生产力的呢? ...
ChatGPT访问互联网,不神秘了

l736696641评论昨天 11:14

ChatGPT访问互联网,不神秘了 ...
为什么百度版“Chat-GPT”发布会成了笑话?

艾的民1评论昨天 11:09

为什么百度版“Chat-GPT”发布会成了笑话? ...
【深度必读】Chat GPT人工智能的致命弱点

qinge1评论昨天 11:01

【深度必读】Chat GPT人工智能的致命弱点 ...
Stable Diffusion模型发布新版本:生成图像以假乱真

Jessielam1评论前天 20:38

Stable Diffusion模型发布新版本:生成图像以假乱真 ...
苹果iOS 18深度解析:一次颠覆性的升级,你准备好了吗?

BoniaMi1评论前天 09:46

苹果iOS 18深度解析:一次颠覆性的升级,你准备好了吗? ...
苹果iOS 18将支持那些机型?目前iOS 18代码里有这些机

艾的民1评论前天 09:40

苹果iOS 18将支持那些机型?目前iOS 18代码里有这些机型的痕迹_百度知 ... ...
抢先揭秘!iOS 18全新升级,这些变化不容错过!

斌琦春芬1评论前天 09:32

抢先揭秘!iOS 18全新升级,这些变化不容错过! ...
iOS18正式版各机型耗电实测,这几款iPhone耗电严重!

Daniellolo1评论前天 09:31

iOS18正式版各机型耗电实测,这几款iPhone耗电严重! ...
ai在线写作-AI智能写作优势和弊端

zwb781评论3 天前

ai在线写作-AI智能写作优势和弊端 ...
ai辅助写作是双刃剑,我的态度与三条规则

SheilaCot1评论3 天前

ai辅助写作是双刃剑,我的态度与三条规则 ...
AI智能在线写作平台,在线原创文章写作工具

Thomaszibe1评论3 天前

AI智能在线写作平台,在线原创文章写作工具 ...
al写作免费软件

Alekseyei5评论3 天前

al写作免费软件 ...
Netflix的牛逼是如何炼成的?

QWERTY21评论5 天前

Netflix的牛逼是如何炼成的? ...
〖WH〗大家有木有觉得airpodspro续航不如2代

艾的民0评论5 天前

刚换。。而且是更新版的，开了降噪正常听歌看视频，感觉掉电好快 ...
海鲜市场出99新airpods 3

艾的民2评论5 天前

海鲜市场出99新airpods 3 ...
预测下这两年iphone

rudybjc14评论5 天前

iphone18 由8GB升级为12GB内存主摄升级为17Pro 主摄搭载vc均热板 a20 2nm， 3nm？硅碳负极电池？提升电池密度 ...
我发现iPadOS26的壁纸超有感觉！

v618122920评论5 天前

刚更新完iPadOS26，这壁纸的质感真的一下子戳到我了～ ...
齐齐哈尔斗山NHP8000机床钣金防护罩-【2026批发一站式

CurtisWhok0评论5 天前

齐齐哈尔斗山NHP8000机床钣金防护罩齐齐哈尔斗山NHP8000钣金防护罩创新设计：庆云金恒兴的匠心突破在重型数控机床领 ...
悦迅福科技｜IML工艺精密注塑件：制造业表面装饰的革

carolynqb40评论5 天前

在消费电子、汽车、家电等高端制造领域，消费者对产品外观的精致度与功能性的要求日益严苛。传统表面装饰工艺因工序繁 ...
要求不高但期待值提生到新高度的3款电视机顶盒

RichgovTauh0评论5 天前

就我个人而言，电视机顶盒是我喜欢的影音产品之一，我强烈分享给所有希望在 4K 电视上获得流媒体画质的用户。当然，简 ...
有没有人出iPhone12呀???

Zhf2fde0q2t7评论5 天前

收一台128g的iPhone12，要求全原无拆，电池效率90左右，最好没什么磕碰，3700左右 ...
LU,离体心脏灌流装置带你了解离体心脏灌流装置

pAxvOHtH0评论5 天前

离体心脏灌流系统是生命科学与医学研究领域的核心实验设备，专为离体哺乳动物心脏相关研究设计，同时能高效完成离体心 ...
a14和骁龙8+哪个强?

艾的民1评论5 天前

a14和骁龙8+哪个强? ...
请问吧里的老司机,怎么买单只airpods pro才能不翻车

reedeageria2评论5 天前

用了三个月的AirPods Pro不幸掉了右耳，找不到了。准备小黄鱼买一只二手的配一对。看到好多卖家都有大批量的二手airp ...
现在二代AirPods哪个店铺比较稳一点?

艾的民5评论5 天前

求推荐！实惠性价比高质量好的～ ...
出/租恶魔头白框人鱼成熟忧冷霸总冷目男号

rfzlv2评论5 天前

「WG402」1.5w出/出租王国钻14带专消24w财富9400w恶魔头白框尘翼银光姜饼人雪人钻石剪纸等套装钻石婚纱剪纸西域等上下 ...
本周iosv小乔巅峰百分百胜率拿标

Williamsi1评论5 天前

两天0基础小国差点排位就稳，巅峰能量剩90。 ...
[BUG反馈]Chrome浏览器启用--force-renderer-accessib

艾的民1评论5 天前

最新版chrome在启用--force-renderer-accessibility浏览页面时会崩溃, 错误代码：STATUS_BREAKPOINT ...
vivo watch5能不能使用表上阅读软件

z547627890评论5 天前

rt 问这个豆包她死都说不行目前在犹豫要不要买。高中生一个月零花钱没有太多试错成本 ...
6月24日巨量更新内容预览

Kennethtype14评论5 天前

现在官网都还没出公告，游戏里倒是先发了，内容是真多，可算感觉给力了一把安卓和IOS也终于互通了 ...
95z隐藏功能！！！！使用apple tv的进来。。

AmindaDrob1评论5 天前

实际上95z也支持这个功能。不懂为什么三星要把这个功能隐藏起来？无意中发现在设置界面把灵视竞技切换为自动，可以 ...
救救孩子吧iPad密码错误太多次停用了显示连接iTunes我

Justinsede7评论5 天前

救救孩子吧 iPad密码错误太多次停用了显示连接iTunes 我按照百度流程连接了点更新提示我iTunes不是最新版本需要更新 ...
2025 美国产业用布及纺织品展，Advanced产业布年度盛

fyupbucb960评论5 天前

✨2025 美国产业用布及纺织品展，Advanced产业布年度盛会来袭，不可错过，冲鸭！各位产业布行业的从业者们👋，今天 ...
【蝙蝠聊天--版本更新】安卓&苹果3.5.0版本已上线

h964046502评论5 天前

蝙蝠最新版本Android&iOS 3.5.0已上线（可至官网下载https://www.batchat.com）主要更以下功能：一、新增水印相机功 ...
Apple TV逆袭击败Netflix拿下最佳影片

艾的民0评论5 天前

哈哈哈哈，网飞是不是哭死了，库克笑开花了。 ...
求一款oled最轻最薄的收纳包,大神指点下呀

aBitcoink5评论5 天前

求一款oled最轻最薄的收纳包，大神指点下呀 ...
switch oled三码合一,底部螺丝轻微划痕,算翻车吗?

p1479063514评论5 天前

switch oled三码合一，底部螺丝轻微划痕，算翻车吗？天猫日本国际买的 ...
苹果2款推迟的新品，终于要来了！

dormir0评论5 天前

苹果在上周发布了iPhone 17e和MacBook Neo等新品，但是备受期待的HomePod mini以及新款Apple TV一直没有出现，现在有 ...
十一代富士通 oled三星屏

oqcnoekx0012评论5 天前

...
手机是iPhone 14pm

lucysdf5评论5 天前

用这个怎么样反正苹果不支持idac，是不是就可以少花点冤枉钱。 ...
等了二个多星期的oled机子终于到了!

艾的民14评论5 天前

新人入坑，刚收到机器好开心哈哈哈 ...
美剧风骚律师1-6季连载更新中百度网盘资源下载～

ddbd甜丽安d2评论5 天前

我的内心世界可能永远缺少了一块，这一块是专属于绝命毒师和风骚律师这十几年来带给我的那些期待与震撼… ...
新人入坑,京东国际买的OLED,红蓝还是白色?

aHNtCqDM13评论5 天前

京东数码海外自营2700，白色感觉很帅但是怕脏而且觉得红蓝才是经典，想玩马趴又在京东自营的买了对灰色joycon，想听听 ...
双12某多翻车的switchOLED 寄回商家测试拒绝售后。

卡乐多卡套13评论5 天前

ZB家的货，一个手柄没反应导致主机不能激活进入系统。寄回换货，昨晚商家发来他们的测试视频视频里显示他们使用手柄 ...
开源剪映小助手(capcut-mate)v3.0.13发布

郑建强0评论5 天前

🚀 核心功能更新 ✨ 重构视频云渲染功能，达到可上生产环境标准修复所有素材类型Transform坐标计算错误：统一使用草 ...
photoshop 2021在m1 mac上导出png发生未知错误的解决

tomsencui0评论5 天前

photoshop 2021 for mac 在M1上导出Png时，会提示“发生了未知错误”，即使点击“导出”按钮，导出的图片也是一个空白 ...
这个游戏怎么这么难啊

DeliveryProMef0评论5 天前

真TMD难 ...
广州电脑经销商批发_广州电脑经销商批发厂家定制直供

mjdrummer0评论5 天前

广州电脑经销商批发🔥揭秘2017年MacBook的轻薄魅力！📚 广州电脑经销商批发厂家定制，今天咱们就来聊聊苹果的这款经 ...
r9000p这个16:10玩游戏真难受

换换优品13评论5 天前

上下黑边，还无法去除，16：10果然不适合打游戏，看的真别扭。这个黑边怎么去除？好多游戏都无法全屏 ...
Oled版百亿补贴的到了,发了个日版本的给我,开心

Richardpefe7评论5 天前

...
M1 PD下运行最终幻想7重制版

艾的民10评论5 天前

久等多时的最终幻想7重制版终于上PC了, 重点是可以使用mod! 于是本人作死在M1 MBP上测试了一下。游戏大小90G+，默认似 ...
【数码荔枝】正版 Bookxnote 高级版 39 元

Preomnert0评论5 天前

现在数码荔枝有活动，使用油惠🐎 tieba95，再叠加首单优惠，39 元就能买到终生版。 ...
vfx123的fcpx插件还有m1芯片都可以用的

十大1评论5 天前

有需要的人可以一起筹！！#fcpx##fcpx插件##后期制作# ...
iphone12听筒无声,苹果官方召回返厂维修

186218621275评论5 天前

#iPhone#召回的政策还是很好，但是去售后服务中心ios14的系统检测不了，需要升级到ios15才能检测，内心真的不能接受升 ...
缺钱用了 iPhone12自用机 128G全新机要的私聊

艾的民2评论5 天前

...
大家的ios15通知设置里有这个图标吗

bonju01024评论5 天前

这个跟踪通知的图标粉色的，以前怎么没有，大家有吗 ...
Omni Recover for Mac (iPhone数据恢复软件) v3.1.6

宝贝宝贝0评论5 天前

Omni Recover macOS可以让你检索被删除的消息、照片、WhatsApp聊天，等等，无论你已经达到了什么阶段。不管原因是什 ...
产品名字太重要了

CCouQPvx1评论5 天前

你看豆包，千问，元宝，文心一言，现在的市场占有率就说明了问题，文心一言基本边缘化的产品，阿里的以前叫通义千问 ...
新一期Q版小人

Rodolfoclub9评论5 天前

由豆包ai制作，没有云山是因为找不到大一点的，太糊了，有没有好心人发一下? ...
目前16比10屏幕最大是17.0还是17.3的?有没有更大的

艾的民1评论5 天前

目前16比10屏幕最大是17.0还是17.3的？有没有更大的？ ...
有在哪里提到过理树不喜欢他的监护人吗？

d281352885评论5 天前

似乎之前在哪里看到过理树跟他的监护人关系不是很好的样子？只是有点印象但是想不起来了，但是印象里又好像也没说他干 ...
如何选靠谱的软件定制开发公司？超详细选型清单

艾的民0评论5 天前

当企业数字化从 “基础搭建” 迈入 “精细运营” 阶段，标准化软件已难以满足个性化业务需求，软件定制开发逐渐成为企 ...
肘一个矩声mini i pro3解码耳放一体机

王攀5评论5 天前

箱说齐全 1950sfby，送一根同轴线啦这款用料挺好的，箭猪的环牛全彩屏幕支持AirPlay2，网线wifi 投送能显示歌词封面 ...
&amp;#x26A0;&amp;#xFE0F;10几万,稀有车型 16

艾的民0评论5 天前

⚠️10几万，稀有车型 16奔驰CLS350 黑武士外观 4座黑外黑内（宝石蓝贴黑膜） 7速波箱 V6机头无框车门后驱操控王 ...
#iPhone 13 Pro#

Timothyon5评论5 天前

官网买的，你们的货是从北京发的还是上海发的#iPhone 13 Pro# ...
macOS 26 vs. macOS 15:深度对比评测,值得升级吗?

seeandy1评论5 天前

macOS 26 vs. macOS 15:深度对比评测,值得升级吗? ...
大伙，有没有什么好用的管理lora的插件啊

艾的民11评论5 天前

刚接触comfyui，下了很多lora来生图玩，但是太多感觉很乱，有没有什么好用的插件可以分类整理一下求求分享一下 ...
三个月后,macOS 26 Tahoe 正式版终于来了!

ShermanBuch1评论5 天前

三个月后,macOS 26 Tahoe 正式版终于来了! ...