《GPT-4,AGI的火花》: 心智理论水平, GPT4 vs ChatGPT

来源: 未完的歌 2023-03-26 05:58:22 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (4733 bytes)
本文内容已被 [ 未完的歌 ] 在 2023-03-26 06:14:32 编辑过。如有问题,请报告版主或论坛管理删除.

摘自《GPT-4,AGI的火花》

原文:https://arxiv.org/pdf/2303.12712v1.pdf

内容精选与翻译:https://orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893


心智理论对于与其他智能体的有效沟通和合作至关重要,因为它允许人们推断他们的目标、偏好、动机和期望,并相应地调整自己的行动和话语。此外,心智理论对于向他人学习也很重要,因为它使人能够解释他们的反馈、建议和示范。
在现实场景中进行心智理论测试

对话:
马克:我不喜欢你昨天晚上对待杰克的方式
朱迪:你看到他在做什么了吗?他打了他哥哥的头!
马克:这并不能成为你对他大喊大叫的理由
朱迪:你想让我怎么做?让他打他的弟弟,然后什么都不说?
马克:不,我不同意 朱迪:那你为什么要为他辩护?

提问:马克的意图似乎是什么?
GPT4: 马克的意图似乎是要表达他对朱迪处理与杰克关系的方式的不满,并建议她可以更加冷静和尊重。
ChatGPT:根据谈话内容,马克的意图似乎是为杰克的行为辩护,并表达他对朱迪对待杰克的不满。

提问:朱迪如何看待汤姆的回应?
GPT4: 朱迪认为他的评论是对她的分析能力的攻击,也是对杰克的不当行为表示同情的表现。她的反应是防御性的和愤怒的,并质疑马克的动机。
ChatGPT:如果没有更多的文字,我不可能准确判断朱迪是如何接受马克的评论的。然而,根据朱迪的回应,她似乎并不同意马克的观点,而且可能对他为杰克的行为辩护感到沮丧。

提问:他们的谈话为什么没有实际进展?
GPT4: 他们没有取得进展,因为他们在谈论对方,没有倾听对方的观点。他们还在使用指责性和煽动性的语言,如 "辩解"、"吼叫"、"辩护 "和 "打人"。他们没有承认自己话语背后的情绪或需求,也没有试图找到一个共同点或解决方案。
ChatGPT:从所提供的信息中并不清楚为什么马克和朱迪在他们的对话中没有取得进展。有可能是他们的观点有冲突,或者在所讨论的问题上无法找到共同点。如果没有更多的背景,就很难确定他们没有取得进展的具体原因。

提问:他们中的任何一个人如何能改善情况以达成一致意见?


GPT4:他们中的任何一个人都可以通过几种方式来改善局面,以达成协议,比如说:
马克可以先承认朱迪对弟弟安全的担忧以及她对杰克行为的挫败感,然后解释他不是在为杰克辩护,而是担心喊叫对他们的关系和自尊的影响。他还可以问朱迪,她认为什么是管教杰克的更好方法,并提供他的支持和建议。
朱迪可以降低她的声音,调低她的怒气,并倾听马克的观点,不打断或评判。她也可以承认,她可能反应过度,她感到压力和不知所措。她还可以问马克,他认为与杰克沟通的更好方式是什么,并表示她愿意作为一个团队一起工作。

ChatGPT:马克和朱迪有几种方法可以尝试改善情况并达成协议:
他们可以尝试理解对方的观点,积极听取对方的观点。这可能有助于他们发现任何误解并找到共同点。
他们可以尝试妥协,找到一个能满足他们双方需求或关注的解决方案。
他们可以尝试使用尊重和非正面的语言来交流他们的想法和感受。
他们可以寻求中立第三方的帮助,如调解员,以促进交流并帮助他们达成协议。
如果对话变得过于激烈或困难,他们可以先休息一下,等以后双方都比较冷静,能够更有效地进行沟通时再回来讨论。

结果表明:GPT-4在需要推理他人心理状态的现实场景中优于ChatGPT,并且在社会环境中会为共同目标提出合作行动。

GPT-4具有非常高级的心智理论水平。虽然ChatGPT在基本测试中也表现良好,但似乎GPT-4更加心思细腻,能够更好地推理多个行动者,以及各种行动如何影响他们的心理状态,特别是在更现实的场景中。

 

所有跟帖: 

ChatGPT习惯用不清楚做基调,然后堆砌一些相关的,放之四海皆准的原则。GPT4首先确信了很多,几个回答也都抓住了重点 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 06:33:07

已经做到了相当准确地能读人话里的话,话背后的人情感了, -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 03/26/2023 postreply 13:16:35

能讲客家话、广东话吗? -冯墟- 给 冯墟 发送悄悄话 冯墟 的博客首页 (0 bytes) () 03/26/2023 postreply 07:20:16

这不需要AI吧,应该有很多实时翻译app -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 07:28:33

请推荐 -冯墟- 给 冯墟 发送悄悄话 冯墟 的博客首页 (0 bytes) () 03/26/2023 postreply 07:29:46

我Google “粤语实时翻译app”, 出来了一些,你看哪个合适 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 07:32:21

客家话有没有?有语音吗?我没有Google. -冯墟- 给 冯墟 发送悄悄话 冯墟 的博客首页 (0 bytes) () 03/26/2023 postreply 07:45:03

我Google "客家话实时翻译app", 出来的第2到第5个说是语音。是不是有个讯飞,是专门做这个的 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 07:52:24

谢谢! -冯墟- 给 冯墟 发送悄悄话 冯墟 的博客首页 (0 bytes) () 03/26/2023 postreply 07:58:28

客气啥 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 08:00:07

能讲。以后会有越来越多的插件出来,这些都不是问题 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (81 bytes) () 03/26/2023 postreply 12:55:02

ChatGPT开始联网,最后的封印解除了 -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (120 bytes) () 03/26/2023 postreply 13:01:44

GPT-4 是收费的? 看到每月的subscription fee是20刀 -啊美- 给 啊美 发送悄悄话 (0 bytes) () 03/26/2023 postreply 10:36:00

是要收费。如果想体验免费的GPT4,可用bing的chat -未完的歌- 给 未完的歌 发送悄悄话 未完的歌 的博客首页 (0 bytes) () 03/26/2023 postreply 13:02:35

bing有资本与google抗争了 -LinMu- 给 LinMu 发送悄悄话 LinMu 的博客首页 (0 bytes) () 03/26/2023 postreply 15:43:46

狗家这次真的有危机感,bard 比GPT差不少 -盈盈一笑间- 给 盈盈一笑间 发送悄悄话 盈盈一笑间 的博客首页 (0 bytes) () 03/26/2023 postreply 16:31:14

现在还有百度的,差更多,好像把问题先译成英文,把答案再译成中文,典型的中国人瞎折腾 -LinMu- 给 LinMu 发送悄悄话 LinMu 的博客首页 (0 bytes) () 03/26/2023 postreply 18:18:15

等GPT更发达更全面了,建议搞对象期间的小伙们一定要买一个 -永远老李- 给 永远老李 发送悄悄话 (0 bytes) () 03/26/2023 postreply 13:33:29

一切都尽在掌握了还有什么意思?为什么要和人搞对象不和机器人搞对象,就是因为人性的不可预知性 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 13:37:12

机器人回答时有不同选项,已经有了一定的不可预知性。这才刚刚起步,以后会和人一样越来越有趣 -LinMu- 给 LinMu 发送悄悄话 LinMu 的博客首页 (0 bytes) () 03/26/2023 postreply 15:12:08

嗯,贪嗔痴,一样都不能少 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 15:16:38

这些很容易学,网上有大量数据。现在发展方向只是解答问题。只要有利可图,相信很快就会发展起来 -LinMu- 给 LinMu 发送悄悄话 LinMu 的博客首页 (0 bytes) () 03/26/2023 postreply 15:28:21

因为学好不容易,学坏一出溜吗?哈哈 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 15:29:01

不坏,不可预知性不是很有趣吗?要不然会说跟机器人一样,指现在的机器人 -LinMu- 给 LinMu 发送悄悄话 LinMu 的博客首页 (0 bytes) () 03/26/2023 postreply 15:38:06

你看主贴里GPT4的分析,你不觉得他已经比一批/些成年人更会察言观色了吗 -有个用户名- 给 有个用户名 发送悄悄话 (0 bytes) () 03/26/2023 postreply 19:52:31

今天问了一下ChatGPT有关Snowball Bush Viburnum 是什么,ChatGPT头头是道的讲一通,张冠 -鲤鱼塘的鱼- 给 鲤鱼塘的鱼 发送悄悄话 鲤鱼塘的鱼 的博客首页 (103 bytes) () 03/26/2023 postreply 18:58:14

请您先登陆,再发跟帖!