新闻
足球投注app它通常会条目你继续提供-足球赌注软件(官方)网站·IOS/安卓通用版/APP

梦晨 发自 凹非寺量子位 | 公众号 QbitAI
苹果&SpaceX前工程师共享o1使全心得,奥特曼、Brockman皆转发了。
划重心:
o1还是不是聊天模子了,需要全新的使用技术。


奥特曼还跑去挖坟作家Ben Hylak数天前的“自我打脸”评述,称“不雅察o1的口碑变化、以及东说念主们学习怎么使用它很有趣”。

Ben Hylak曾任SpaceX软件工程师、VisionOS东说念主机交互打算师,目下在创业为AI产物提供分析处事。
具体来说,Ben在o1 pro推出满血$200/月版块的第一天就交钱了,整整测试了一天后得出论断:它果真很灾祸!
每次发问皆要恭候5分钟会输出首尾乖互的建议莫得条目但老是会陈说架构图+上风/过错列表

Ben把灾祸的体验发在网上后,许多东说念主默示同感。但有趣的是,也有东说念主激烈反对。
他运转与抓不同不雅点的征询,然后意志到蓝本是我方的技术十足错了。
我还在把o1当聊天模子来用,但o1还是不是聊天模子了。
当今,Ben还是从怨恨o1,转造成了每天皆在用它处置最紧要的问题。
像对待新职工通常对待o1
淌若说o1不是聊天模子了,那它当今是什么?
Ben合计它就像一个“敷陈生成器”。淌若你给它饱和的高下文,并告诉它你想要输出什么,它通常会一次性找到处置决策。
OpenAI官方其实给了一个讲理的o1使用建议,但并不完善。

Ben的建议包括:
提供海量布景信息
不论你当今是何如领略“海量”的,再乘以10倍。
当使用GPT-4o或Claude 3.5等聊天模子时,通常会从一个讲理的问题和一些布景信息运转。淌若模子需要更多布景信息,它通常会条目你继续提供。
这便是聊天模子的施行,从一来一趟的交互中握住完善输出。
但o1只会从名义上回答你淡薄的问题,不会试图从你那处得回布景信息。是以需要反过来将尽可能多的高下文主动发给它。
即使仅仅问一个讲理的代码工程问题,应该提供:
阐明注解所有你尝试过但不起作用的决策一份完满的数据库schemas阐明注解一下你的公司是作念什么的,范围多大,界说里面术语
一言以蔽之,就像对待新职工通常对待o1。

描写你想要什么,而不是率领它怎么作念
关于大大皆聊天模子,咱们皆会告诉模子但愿他怎么陈说口头,比如“上演一位软件工程各人,请仔细念念考”。
但在o1上有用的技术正相背,告诉它你需要什么,而不是率领它怎么去作念。
Ben把o1的指示词模板分红4部分:
主义放在最前边精明指定输出样式不错附加需要查验的珍摄事项海量联系的布景信息

临了,o1的输出有一种学术/营业敷陈的作风。Ben合计太多的推理token让它很难开脱这种作风
他曾试图让o1来完成这篇著述,但历程屡次尝试,只可得到终点庸碌的学生功课。

One More Thing
在奥特曼的转发推文中,有东说念主套出了最新音尘:
o3暂时还不会向用户通达,o3-mini会先推出,况兼时刻不远了。

o3-mini会先提供给Plus订阅用户使用,API的订价OpenAI里面还没笃定,但不会很贵。

参考聚会:[1]https://www.latent.space/p/o1-skill-issue[2]https://x.com/sama/status/1877814065088663763[3]https://x.com/gdb/status/1878489681702310392
