简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
1您的位置: 文学城 » 新闻 » 焦点新闻 » 揭秘华人创办的数据标注帝国:去年营收10亿美元

揭秘华人创办的数据标注帝国:去年营收10亿美元

文章来源: 腾讯科技 于 2025-06-19 19:09:00 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数



揭秘华人创办的数据标注帝国:去年营收10亿美元

6月19日消息,在Meta与Scale AI(以下简称“Scale”)达成143亿美元的投资交易后,数据标注这一曾被忽视的领域正迅速成为硅谷新的焦点。对埃德温.陈(Edwin Chen)创立的Surge AI(以下简称“Surge”)而言,这无疑是一个历史性的发展机遇。

事实上,数据标注在硅谷长期处于行业边缘地带——作为人工智能技术链条中的核心环节,其重要性与关注度长期不匹配。谷歌、OpenAI等科技巨头通常需要依赖外部服务机构,通过对AI模型输出内容进行细致的质量分级与校验,才能实现模型性能的持续优化。这种看似繁琐的人工标注工作,实则是支撑AI系统迭代升级的关键基础。

Meta收购Scale股权的重磅交易,突然间把数据标注业务推向行业聚光灯下。然而,就实际市场份额和业务竞争力而言,埃德温.陈(Edwin Chen)创立的Surge才是当前数据标注领域的真正龙头。

01.‌无融资实现营收反超的“隐形冠军”

Surge凭借“把客户AI训练至行业最高标准”的核心承诺,成功赢得谷歌、OpenAI、Anthropic等科技巨头的青睐。埃德温.陈为公司设立了极具野心的技术愿景:打造具备真正“创造力与意外发现能力”的AI系统。他描绘了这样的理想场景——当模型收到“创作一首关于月亮的八行诗”的指令时,能输出足以“令人潸然泪下”的文学作品。

37岁的埃德温.陈没有任何投资者,完全依靠自力更生创办了这家成立已有五年的初创公司。Surge现有110名员工‌,在纽约和旧金山设有办公室。该公司曾向员工透露,其营收去年已超过10亿美元‌,超过了Scale同期‌8.7亿美元‌的营收。埃德温.陈还表示,与Scale不同,Surge从创立之初就实现了盈利。此外,如果其他公司效仿OpenAI——因担忧Scale与Meta的关系而停止与Scale合作——将业务转向Surge,Surge的营收可能会进一步增长。

不过,Surge的其他关键财务数据仍不得而知,例如,Surge在向数量庞大的合同工支付劳动力成本后保留的营收(大多数类似公司,如Scale,会将约一半营收支付给合同工)。如果Surge能获得与Scale类似的估值(Meta在投资中对其估值为290亿美元),这一价格将使埃德温.陈至少在账面上成为亿万富翁,并悄然跻身科技界最富有人士之列。

随着AI模型从“玩具”转变为真正的商业工具,数据标注变得愈发重要。Surge等公司雇佣的合同工会对AI模型的响应进行分级,并在编程、数学和法律等领域编写数千个问题和答案,输入给AI模型——本质上是教会它们什么是“优质回答”。Surge子公司Data Annotation Tech官网的信息显示,其员工”可自行安排时间训练AI获得报酬”,起薪为每小时20美元‌。

埃德温.陈把Surge定位为“‌高端服务商‌”,收费通常是Scale的2至5倍‌,并以“行业领先的工作质量”证明其定价的合理性。一位前Scale员工表示,事实上,在客户对标注质量的审计中,Surge的表现往往优于 Scale。Surge的竞争对手、得到凯鹏华盈投资的初创公司Handshake的负责人加勒特.洛德(Garrett Lord)也坦言,Surge才是当之无愧的行业龙头。

Meta以巨额交易收购Scale的‌新闻报道‌并未提及Surge。Scale前首席执行官汪滔(Alexandr Wang)曾被公认为数据标注领域的领军人物。作为如今Meta AI业务的高管,他在硅谷颇具知名度:不仅频繁亮相播客与行业会议,还在X平台保持高频发帖。他之前筹集到15亿美元‌风险投资,让Scale跻身极少数融资达此规模的公司之列,并雇佣了超过1000名员工‌。

Surge及其竞争对手有时也会因负面新闻登上头条。例如,今年5月,Surge在加利福尼亚州遭遇一宗集体诉讼‌,原告称该公司之所以能发展得如此庞大且盈利,部分原因在于违法。这起由Surge部分合同工提起的诉讼称,公司将员工错误分类为合同工,未支付他们必须完成的部分工作报酬,如培训课程和为确保工作质量而参加的资格考试。Scale和其他数据标注公司也面临类似的集体诉讼。

代表诉讼原告的克拉克森律师事务所(Clarkson Law Firm)合伙人格伦.达纳斯(Glenn Danas),把此类AI初创公司的工作条件描述为“‌反乌托邦式的‌”。Surge发言人则称该诉讼“‌毫无根据‌”。

02.从硅谷工程师到行业颠覆者

埃德温.陈在麻省理工学院攻读语言学与数学。毕业后,他先后任职于Facebook、Dropbox、谷歌和Twitter,担任机器学习工程师,主导推荐系统、搜索算法开发及训练数据采集等核心工作。这段顶级科技公司的从业经历,让他亲眼目睹了大公司在数据标注环节的现实困境。

以在Facebook工作时期为例,他曾负责开发一款Yelp竞品,团队需要训练一个能准确分类企业类型(如区分餐厅与杂货店)的模型。当时外包机构告知,完成包含5万个企业样本的精准标注数据集需要长达6个月时间。更棘手的是,最终交付的数据存在严重质量问题(如将餐厅误标为医院),这一经历直接促使他萌生了创立Surge的想法——立志解决传统数据标注行业效率与质量双低的痛点。

“我们除了等待别无他法,” 埃德温.陈说。当数据交回来时,他惊呆了:在某些情况下,餐厅被标注为咖啡店,咖啡店被标注为医院。“这些数据完全是垃圾,”他说。

2020年,他离开Twitter创立Surge,并通过硅谷创业者特有的方式——在旧金山Dogpatch社区和教会区的攀岩馆偶遇Airbnb和Neeva(一家曾被看好的AI搜索引擎初创公司)的高管,向他们推销自己的公司——获得了首批客户。

为推动Surge起步,埃德温.陈招募了此前工作中认识的数据标注合同工,并用自己的积蓄为公司注资。巧合的是,当语言模型开始变得重要时,埃德温.陈把业务聚焦于这一领域——而Scale最初则专注于为自动驾驶汽车评估更可视化的数据。

不到一年后,OpenAI就与Surge签约,聘请后者对其模型进行微调,通过基于双方共同发表的研究论文,教模型避免产生有害响应(如种族偏见语言)。到2022年,Anthropic也成为Surge的客户,该公司部分依赖Surge的合同工来评估大语言模型是否能帮助人类监控其他AI,试图在全行业开发类人AI的探索中建立安全检查机制。

数据标注还能确保模型响应的风格一致性。知情人士透露,某企业科技公司曾使用Surge的合同工编写代码行及其附带解释。这些代码和解释不仅必须正确,还需要在不同标注者的示例中保持相似的结构、长度和复杂程度,以确保该公司训练的模型能输出符合其风格的代码。

03.‌行业共性与Surge的神秘护城河‌

Surge的客户表示,Surge对其内部流程及快速生成高质量数据的技术细节守口如瓶,但这种情况在业内并不罕见。“这和我与云服务提供商合作时的情况一样,” 上述企业科技客户说,“我不知道他们的服务为何能如此出色的内部原理,我只需按下按钮,就会为其背后的工作成效感到高兴。”

数据标注公司通常会使用各种技术,确保合同工在回答问题时不敷衍了事。例如,这些公司会随机插入无标准答案的"陷阱题",或要求多名标注者对同一问题的正确答案达成共识。

挑选合同工同样重要,尤其是当模型开发者在计算生物学和理论物理等高级领域编写问答示例时,越来越需要受过良好教育的合同工,埃德温.陈不愿详细说明公司如何管理标注者响应的质量,但他表示,除了初始筛选流程,Surge会‌持续评估合同工。他说,公司可以通过多种信号(例如承包商使用的词汇或光标移动轨迹)判断响应是否高质量。

即使在投资Scale之前,Meta也在Surge上投入了大量资金。据知情人士透露,去年,Meta的生成式AI团队向Surge支付了超过1.5亿美元‌用于数据标注工作,Surge负责从始至终管理整个流程。该人士称,这与流向Scale的约2亿美元‌相差不远。

‌一些客户反映Surge长期处于满负荷运营状态,承接项目需预先支付数千万美元的承诺金。与此同时,OpenAI等模型开发者正通过Mercor等招聘机构自建标注团队,试图绕过第三方服务商。此外,数据标注行业的参与者数量持续增加,这一趋势已对市场价格形成下行压力——例如谷歌作为Surge的长期客户,为避免供应链依赖正拓展多供应商合作体系,并成功与Surge协商降低服务报价。

面对关于业务增长持续性的质疑,埃德温.陈显得颇为从容。他指出公众对数据标注行业存在认知偏差,普遍低估了维持高质量标准的技术门槛。他说:“人们总是想当然地认为,只要聚集10万名高学历人才——比如博士群体——让他们自由发挥就能产出优质数据。但实际情况是,未经系统化管理的人力投入,只会导致标注质量的严重参差不齐。” 在他看来,Surge构建的标准化质控体系,正是应对行业同质化竞争的核心壁垒。

  • 海外省钱快报,掌柜推荐,实现买买买自由!
查看评论(0)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

恨死川普?这国怒了疯狂抛售美债 竟是中国7倍
全网气炸!中国男搭飞机狂吸电子烟 厦航冷回一句…
韦东奕食堂吃饭时被多人轮番拍照 画面令人窒息…
不卸妆22年?中国女变“关公” 脸部红肿硬如壳
俄大使证实俄军损失 数字保守但仍太惊人




24小时讨论排行

川普点头了?以总理:不排除“斩首”哈梅内伊
走向深渊,中国一个时代的引擎正在熄火
川普“最快这周末”打伊朗 外媒:多联邦机构备战中
川普再骂鲍威尔:愚蠢 最具破坏性的人 美国耻辱…
特朗普:假期实在太多,不利于“美国再次伟大”
"哈梅内伊去死!" 伊朗民众纷批政权 女生攻佔学校
埃尔多安称“内塔尼亚胡比希特勒更甚”,以色列怒了
留学生急逃离德黑兰:警察打趣"一车疲惫的中国人"
白宫:川普两週内决定会否介入 冀用外交解决
真悲哀:中国社畜疯吃“人用饲料” 3分钟搞定一餐
意外怀上龙种 一胎99子?中国短剧再创“癫”峰
强硬的表象下,伊朗可打的牌已经不多了
川普让防长赫格塞斯坐冷板凳 改信顺从有经验的幕僚
中国挑战美元世界主要货币地位,推动人民币国际化
英国公司拒聘中国人任涉国安工作 法官判“可以”
马克龙:以色列"立即停止"与伊核计划无关的袭击
文学城新闻
切换到网页版

揭秘华人创办的数据标注帝国:去年营收10亿美元

腾讯科技 2025-06-19 19:09:00



揭秘华人创办的数据标注帝国:去年营收10亿美元

6月19日消息,在Meta与Scale AI(以下简称“Scale”)达成143亿美元的投资交易后,数据标注这一曾被忽视的领域正迅速成为硅谷新的焦点。对埃德温.陈(Edwin Chen)创立的Surge AI(以下简称“Surge”)而言,这无疑是一个历史性的发展机遇。

事实上,数据标注在硅谷长期处于行业边缘地带——作为人工智能技术链条中的核心环节,其重要性与关注度长期不匹配。谷歌、OpenAI等科技巨头通常需要依赖外部服务机构,通过对AI模型输出内容进行细致的质量分级与校验,才能实现模型性能的持续优化。这种看似繁琐的人工标注工作,实则是支撑AI系统迭代升级的关键基础。

Meta收购Scale股权的重磅交易,突然间把数据标注业务推向行业聚光灯下。然而,就实际市场份额和业务竞争力而言,埃德温.陈(Edwin Chen)创立的Surge才是当前数据标注领域的真正龙头。

01.‌无融资实现营收反超的“隐形冠军”

Surge凭借“把客户AI训练至行业最高标准”的核心承诺,成功赢得谷歌、OpenAI、Anthropic等科技巨头的青睐。埃德温.陈为公司设立了极具野心的技术愿景:打造具备真正“创造力与意外发现能力”的AI系统。他描绘了这样的理想场景——当模型收到“创作一首关于月亮的八行诗”的指令时,能输出足以“令人潸然泪下”的文学作品。

37岁的埃德温.陈没有任何投资者,完全依靠自力更生创办了这家成立已有五年的初创公司。Surge现有110名员工‌,在纽约和旧金山设有办公室。该公司曾向员工透露,其营收去年已超过10亿美元‌,超过了Scale同期‌8.7亿美元‌的营收。埃德温.陈还表示,与Scale不同,Surge从创立之初就实现了盈利。此外,如果其他公司效仿OpenAI——因担忧Scale与Meta的关系而停止与Scale合作——将业务转向Surge,Surge的营收可能会进一步增长。

不过,Surge的其他关键财务数据仍不得而知,例如,Surge在向数量庞大的合同工支付劳动力成本后保留的营收(大多数类似公司,如Scale,会将约一半营收支付给合同工)。如果Surge能获得与Scale类似的估值(Meta在投资中对其估值为290亿美元),这一价格将使埃德温.陈至少在账面上成为亿万富翁,并悄然跻身科技界最富有人士之列。

随着AI模型从“玩具”转变为真正的商业工具,数据标注变得愈发重要。Surge等公司雇佣的合同工会对AI模型的响应进行分级,并在编程、数学和法律等领域编写数千个问题和答案,输入给AI模型——本质上是教会它们什么是“优质回答”。Surge子公司Data Annotation Tech官网的信息显示,其员工”可自行安排时间训练AI获得报酬”,起薪为每小时20美元‌。

埃德温.陈把Surge定位为“‌高端服务商‌”,收费通常是Scale的2至5倍‌,并以“行业领先的工作质量”证明其定价的合理性。一位前Scale员工表示,事实上,在客户对标注质量的审计中,Surge的表现往往优于 Scale。Surge的竞争对手、得到凯鹏华盈投资的初创公司Handshake的负责人加勒特.洛德(Garrett Lord)也坦言,Surge才是当之无愧的行业龙头。

Meta以巨额交易收购Scale的‌新闻报道‌并未提及Surge。Scale前首席执行官汪滔(Alexandr Wang)曾被公认为数据标注领域的领军人物。作为如今Meta AI业务的高管,他在硅谷颇具知名度:不仅频繁亮相播客与行业会议,还在X平台保持高频发帖。他之前筹集到15亿美元‌风险投资,让Scale跻身极少数融资达此规模的公司之列,并雇佣了超过1000名员工‌。

Surge及其竞争对手有时也会因负面新闻登上头条。例如,今年5月,Surge在加利福尼亚州遭遇一宗集体诉讼‌,原告称该公司之所以能发展得如此庞大且盈利,部分原因在于违法。这起由Surge部分合同工提起的诉讼称,公司将员工错误分类为合同工,未支付他们必须完成的部分工作报酬,如培训课程和为确保工作质量而参加的资格考试。Scale和其他数据标注公司也面临类似的集体诉讼。

代表诉讼原告的克拉克森律师事务所(Clarkson Law Firm)合伙人格伦.达纳斯(Glenn Danas),把此类AI初创公司的工作条件描述为“‌反乌托邦式的‌”。Surge发言人则称该诉讼“‌毫无根据‌”。

02.从硅谷工程师到行业颠覆者

埃德温.陈在麻省理工学院攻读语言学与数学。毕业后,他先后任职于Facebook、Dropbox、谷歌和Twitter,担任机器学习工程师,主导推荐系统、搜索算法开发及训练数据采集等核心工作。这段顶级科技公司的从业经历,让他亲眼目睹了大公司在数据标注环节的现实困境。

以在Facebook工作时期为例,他曾负责开发一款Yelp竞品,团队需要训练一个能准确分类企业类型(如区分餐厅与杂货店)的模型。当时外包机构告知,完成包含5万个企业样本的精准标注数据集需要长达6个月时间。更棘手的是,最终交付的数据存在严重质量问题(如将餐厅误标为医院),这一经历直接促使他萌生了创立Surge的想法——立志解决传统数据标注行业效率与质量双低的痛点。

“我们除了等待别无他法,” 埃德温.陈说。当数据交回来时,他惊呆了:在某些情况下,餐厅被标注为咖啡店,咖啡店被标注为医院。“这些数据完全是垃圾,”他说。

2020年,他离开Twitter创立Surge,并通过硅谷创业者特有的方式——在旧金山Dogpatch社区和教会区的攀岩馆偶遇Airbnb和Neeva(一家曾被看好的AI搜索引擎初创公司)的高管,向他们推销自己的公司——获得了首批客户。

为推动Surge起步,埃德温.陈招募了此前工作中认识的数据标注合同工,并用自己的积蓄为公司注资。巧合的是,当语言模型开始变得重要时,埃德温.陈把业务聚焦于这一领域——而Scale最初则专注于为自动驾驶汽车评估更可视化的数据。

不到一年后,OpenAI就与Surge签约,聘请后者对其模型进行微调,通过基于双方共同发表的研究论文,教模型避免产生有害响应(如种族偏见语言)。到2022年,Anthropic也成为Surge的客户,该公司部分依赖Surge的合同工来评估大语言模型是否能帮助人类监控其他AI,试图在全行业开发类人AI的探索中建立安全检查机制。

数据标注还能确保模型响应的风格一致性。知情人士透露,某企业科技公司曾使用Surge的合同工编写代码行及其附带解释。这些代码和解释不仅必须正确,还需要在不同标注者的示例中保持相似的结构、长度和复杂程度,以确保该公司训练的模型能输出符合其风格的代码。

03.‌行业共性与Surge的神秘护城河‌

Surge的客户表示,Surge对其内部流程及快速生成高质量数据的技术细节守口如瓶,但这种情况在业内并不罕见。“这和我与云服务提供商合作时的情况一样,” 上述企业科技客户说,“我不知道他们的服务为何能如此出色的内部原理,我只需按下按钮,就会为其背后的工作成效感到高兴。”

数据标注公司通常会使用各种技术,确保合同工在回答问题时不敷衍了事。例如,这些公司会随机插入无标准答案的"陷阱题",或要求多名标注者对同一问题的正确答案达成共识。

挑选合同工同样重要,尤其是当模型开发者在计算生物学和理论物理等高级领域编写问答示例时,越来越需要受过良好教育的合同工,埃德温.陈不愿详细说明公司如何管理标注者响应的质量,但他表示,除了初始筛选流程,Surge会‌持续评估合同工。他说,公司可以通过多种信号(例如承包商使用的词汇或光标移动轨迹)判断响应是否高质量。

即使在投资Scale之前,Meta也在Surge上投入了大量资金。据知情人士透露,去年,Meta的生成式AI团队向Surge支付了超过1.5亿美元‌用于数据标注工作,Surge负责从始至终管理整个流程。该人士称,这与流向Scale的约2亿美元‌相差不远。

‌一些客户反映Surge长期处于满负荷运营状态,承接项目需预先支付数千万美元的承诺金。与此同时,OpenAI等模型开发者正通过Mercor等招聘机构自建标注团队,试图绕过第三方服务商。此外,数据标注行业的参与者数量持续增加,这一趋势已对市场价格形成下行压力——例如谷歌作为Surge的长期客户,为避免供应链依赖正拓展多供应商合作体系,并成功与Surge协商降低服务报价。

面对关于业务增长持续性的质疑,埃德温.陈显得颇为从容。他指出公众对数据标注行业存在认知偏差,普遍低估了维持高质量标准的技术门槛。他说:“人们总是想当然地认为,只要聚集10万名高学历人才——比如博士群体——让他们自由发挥就能产出优质数据。但实际情况是,未经系统化管理的人力投入,只会导致标注质量的严重参差不齐。” 在他看来,Surge构建的标准化质控体系,正是应对行业同质化竞争的核心壁垒。