以前下班后,偶尔小公园转一转,冷风吹在身上,仿佛嘲讽我那没什么希望的前途
2025年12月14日,03:20:31
3037 字,阅读约 7 分钟

.idea 2025-12-14 01:34:24 @风很大 豆包的那个ai手机模型开源了,你感觉怎么样?

风飞扬 2025-12-14 02:01:00 啊?

风飞扬 2025-12-14 02:01:02 模型开源?

风飞扬 2025-12-14 02:01:16 字节很封闭的

风飞扬 2025-12-14 02:03:19 字节似乎没开源模型

风飞扬 2025-12-14 02:03:21 但是论文可能发布

风飞扬 2025-12-14 02:03:56 你说的可能是这个

风飞扬 2025-12-14 02:03:56 这个确实是一个

风飞扬 2025-12-14 02:04:11 不知道是模型还是代码,但确实是操作手机的,用的adb

风飞扬 2025-12-14 02:04:27 这个是可以上手用的,字节只会开源论文。

风飞扬 2025-12-14 02:04:36 字节特别封闭

风飞扬 2025-12-14 02:07:56 但是对于豆包AI手机这个产品来说,我有很多看法

风飞扬 2025-12-14 02:08:23 【【老戴】豆包手机到底在看你什么?我抓到了它的真实工作流程-哔哩哔哩】 https://b23.tv/gS5nl49

风飞扬 2025-12-14 02:08:43 【AutoGLM开源:每台手机,都可以成为AI手机-哔哩哔哩】 https://b23.tv/7RZSrp2

风飞扬 2025-12-14 02:11:05 我看了这个视频以及视频的评论,评论很有奇思妙想。

然后我去拉屎了,拉屎期间思考了一些内容。

结合我对Agent的了解,以及对互联网大厂的主观感受,我思考了很多,但最终的结论是一句话。

风飞扬 2025-12-14 02:12:08 OPPO这样的手机厂商搞,为了增加噱头多卖手机,没有需求就创造新的需求,为了和其他手机厂商竞争。

风飞扬 2025-12-14 02:13:25 字节搞这个,为了给豆包续命,大厂人多钱多,多占领一份无关紧要的领域即:自动化操作手机。

他本来可能想通过豆包app去实现,但实现不了,不好用,则不得不造个手机。

风飞扬 2025-12-14 02:16:16 更大的阴谋是,如果有能力把模型的成本与模型的能力搞定。

模型的成本很高,想办法变低,或者用广告、数据收益抵消。

模型的能力目前还是demo阶段,真正可用,能带来生产级别的价值,高附加值。

搞定这俩,才有可能让用户免费用上这玩意,然后卖一波手机,再到建立生态。

用户付费用也可以,OpenAI和Claude就是付费用的,豆包需要有那样的价值。

国产模型有那样的价值么,很难说。

风飞扬 2025-12-14 02:18:36 但,这个更大的目的,即使是字节,也没那么容易实现。

现在流量变现真那么容易了吗?广告和数据都是有代价的,最终会落到消费者身上,数据怎么卖,最终都得有人为此付钱,除非卖给政府,政府有钱。

所以,当消费不行的时候,上游产业不可能不受影响。

消费行不行,看看双十一成交额,看看直播间的家人们。

没有以前那么火热了。

风飞扬 2025-12-14 02:18:58 但是我觉得卖给政府绝对是好主意

风飞扬 2025-12-14 02:21:42 数据只要用好,能利民生。

现在政府对这些互联网大厂的数据其实不怎么共享,政府有政府的数据,但互联网大厂的数据似乎没有提供给政府,比如微信、支付宝的支付数据。

想要知道准确的消费情况,这些数据很有价值。

风飞扬 2025-12-14 02:22:45 假如自动化操作手机这个技术真正成熟了,那么有很多工作可以做。

风飞扬 2025-12-14 02:25:38 互联网大厂面向C端,那地方政府呢,他们会不会有政务方面的自动化需求,私有化部署一下,一些小企业借助成熟方案赚一笔。

私企呢,还是老方法,私有化部署,定制化解决方案,赚一笔。

只要大框架成熟,就跟pytorch库一样,需求能实现,那需求都是在的,钱就会如雨中春笋般冒出来。

而一些老板就会投资,互联网民工就会有岗位,有饭吃,有钱赚。

风飞扬 2025-12-14 02:27:22 但是我觉得成熟不太可能。

就没什么成熟的情况。

就拿文本处理来说,LLM比传统NLP慢、贵。

而高级的一些应用,开源模型又不行,训练又没数据,闭源模型又死贵。

风飞扬 2025-12-14 02:28:11 我现在就有点卡住,用gpt5-high能符合需求,但是贵啊。

用国产模型,我感觉够呛。

风飞扬 2025-12-14 02:28:41 我这还不算什么高级的应用,比豆包AI手机这种简单多了

风飞扬 2025-12-14 02:28:59 豆包AI手机在实际使用的稳定性,还很难说。

风飞扬 2025-12-14 02:31:56 大模型在昙花一现之后,感觉放缓了。

sora确实能生成不错的视频,成本呢。

现在大厂都搞高附加值的东西,比如编程Agent,这种东西可以卖的贵一点。

一些价值不高,但是有用,辽宁舰打蚊子的东西,很不划算。

风飞扬 2025-12-14 02:53:40 字节不太可能开源,我感觉,代码倒是有可能,模型不太好说。

开源一个Agent代码其实意义不是很大。

claude code也能用别的模型,用别的模型就是claude code了?并不是,性能差别很大。

所以,不是Agent的问题。

===

我倒是期待在电脑、手机自动化方面,大厂行行好造点数据,训练一些泛化还不错的模型,至少在一些使用场景上能用,专门为那些场景做优化。

然后,小企业拿来部署部署,给政企客户安排个几百万的订单,我这样的程序员能入职赚个几万块钱。

很通用的小型手机自动化模型是不现实的,gpt5自动化能怎么样,估计一般。

但是为一些场景专门训练,再得到一些泛化能力,是现实的。

例如,将数据从excel表格一条条录入管理系统,操作管理系统进行若干次数据的查询与导出。

===

我之前想过淘宝购物Agent,后来淘宝有AI问答了,但是它现在甚至没办法把商品添加到我的购物车,我明确告诉它了把商品添加到购物车。

我当时没做的原因是,我认为淘宝会做,我认为数据获取难度较高,数据混乱不够清晰,模型能力其实还行,但数据不行导致模型推理的结果不够准确。

结果,淘宝也有这个问题,当你限定价格和具体的产品信息时,例如尺寸、重量、一箱的数量,它就完犊子了,有些东西甚至页面就没写,得问商家的客服。

然后,智谱的宣传视频: AutoGLM开源:每台手机,都可以成为AI手机-哔哩哔哩】 https://b23.tv/7RZSrp2

选的场景还是购物。

我觉得,做好购物这一个就不错了。连淘宝都没做好。淘宝是没用心做。添加到购物车这不是顺手的事儿嘛

===

还有一个扩展思路,商家也可以有Agent,自建一个知识库,用户问过的问题就在里面,那么,当用户的Agent去搜索的时候,直接对接商家的Agent就行了。

===

未来的自动化操作手机,能自己翻商品、看评价、和客服掰扯、获取所有必要信息特别是价格、数量、重量、大小等用户关心的内容,并做出最终购买决定时,这玩意就成功了。

有些东西,用户有需求,但是他不会说,这得根据大数据、用户的历史习惯、模型主动询问,共同实现。

比如,我买点零食和同事一起吃,我的预算是50,那么数量就很重要,假设我分给3~5个人,通常情况下,基本上就是10人以内,我肯定希望买来的零食,分给同事之后,还能剩下80%。

结果模型给了我一个一箱只要20包的零食,这不是扯淡。

或者,夏天我买个大桶冰激凌吃,结果模型给我的商品,到家之后,tmd桶太大,冰箱柜子放不下,这不是扯淡。

所以,问问要分给多少同事,懂得考虑数量,懂得询问用户冰箱多达,以至于根据图片估算冰箱柜子大小,这都是购物Agent的基本能力。

风飞扬 2025-12-14 02:53:55 更不用说货比三家了,字节加油就行了。

风飞扬 2025-12-14 02:55:27 这些东西,用OpenAI的gpt5-high,我相信可以以及其缓慢的速度做到。

不是做不到,只是慢。

而国产模型,做到就很难说了。

风飞扬 2025-12-14 03:01:13 再扩展一下,其实买东西这种事情,和点外卖,做家务一样,以前都是家庭主妇做的事情。

可不要小看了这些事情的难度,一些30岁以上的全职太太这方面有专利般的存在,本质上是一些鸡毛蒜皮的事儿,看上去简单,但是门道不少,模型难以做好。

一旦模型做好了,那么再安装一个身体,机器人保姆也是有可能的。

这些事情的共同点就是,不像训模型写代码,它技术性不强,但吃经验,都是一些照顾人的技术。

帮你做生活上的事儿,本身就是仆人的活。

风飞扬 2025-12-14 03:03:16 这不就相当于清朝时期大户人家的管家一职位,以前这可是正儿八经的岗位。

风飞扬 2025-12-14 03:09:44 我们公司之前有个不成文的规定,谁拖了项目后腿,谁买零食分一分

风飞扬 2025-12-14 03:11:36 后来我养成了一个习惯,下班定闹钟,闹钟响了吃零食,因为还得加班,饿。

弄了两箱零食,一般是上班开始之后下班之前吃一吃,增加幸福感。

风飞扬 2025-12-14 03:13:32 每天的盼头就是下班之后吃口零食。

吃完晚饭又得回到自己蜗居般的出租屋。

偶尔小公园转一转,冷冷的风吹在身上,仿佛嘲讽我那没什么希望的前途。