.idea 2025-12-14 01:34:24 @风很大 豆包的那个ai手机模型开源了,你感觉怎么样?
风飞扬 2025-12-14 02:01:00 啊?
风飞扬 2025-12-14 02:01:02 模型开源?
风飞扬 2025-12-14 02:01:16 字节很封闭的
风飞扬 2025-12-14 02:03:19 字节似乎没开源模型
风飞扬 2025-12-14 02:03:21 但是论文可能发布
风飞扬 2025-12-14 02:03:56 你说的可能是这个
风飞扬 2025-12-14 02:03:56 这个确实是一个
风飞扬 2025-12-14 02:04:11 不知道是模型还是代码,但确实是操作手机的,用的adb
风飞扬 2025-12-14 02:04:27 这个是可以上手用的,字节只会开源论文。
风飞扬 2025-12-14 02:04:36 字节特别封闭
风飞扬 2025-12-14 02:07:56 但是对于豆包AI手机这个产品来说,我有很多看法
风飞扬 2025-12-14 02:08:23 【【老戴】豆包手机到底在看你什么?我抓到了它的真实工作流程-哔哩哔哩】 https://b23.tv/gS5nl49
风飞扬 2025-12-14 02:08:43 【AutoGLM开源:每台手机,都可以成为AI手机-哔哩哔哩】 https://b23.tv/7RZSrp2
风飞扬 2025-12-14 02:11:05 我看了这个视频以及视频的评论,评论很有奇思妙想。
然后我去拉屎了,拉屎期间思考了一些内容。
结合我对Agent的了解,以及对互联网大厂的主观感受,我思考了很多,但最终的结论是一句话。
风飞扬 2025-12-14 02:12:08 OPPO这样的手机厂商搞,为了增加噱头多卖手机,没有需求就创造新的需求,为了和其他手机厂商竞争。
风飞扬 2025-12-14 02:13:25 字节搞这个,为了给豆包续命,大厂人多钱多,多占领一份无关紧要的领域即:自动化操作手机。
他本来可能想通过豆包app去实现,但实现不了,不好用,则不得不造个手机。
风飞扬 2025-12-14 02:16:16 更大的阴谋是,如果有能力把模型的成本与模型的能力搞定。
模型的成本很高,想办法变低,或者用广告、数据收益抵消。
模型的能力目前还是demo阶段,真正可用,能带来生产级别的价值,高附加值。
搞定这俩,才有可能让用户免费用上这玩意,然后卖一波手机,再到建立生态。
用户付费用也可以,OpenAI和Claude就是付费用的,豆包需要有那样的价值。
国产模型有那样的价值么,很难说。
风飞扬 2025-12-14 02:18:36 但,这个更大的目的,即使是字节,也没那么容易实现。
现在流量变现真那么容易了吗?广告和数据都是有代价的,最终会落到消费者身上,数据怎么卖,最终都得有人为此付钱,除非卖给政府,政府有钱。
所以,当消费不行的时候,上游产业不可能不受影响。
消费行不行,看看双十一成交额,看看直播间的家人们。
没有以前那么火热了。
风飞扬 2025-12-14 02:18:58 但是我觉得卖给政府绝对是好主意
风飞扬 2025-12-14 02:21:42 数据只要用好,能利民生。
现在政府对这些互联网大厂的数据其实不怎么共享,政府有政府的数据,但互联网大厂的数据似乎没有提供给政府,比如微信、支付宝的支付数据。
想要知道准确的消费情况,这些数据很有价值。
风飞扬 2025-12-14 02:22:45 假如自动化操作手机这个技术真正成熟了,那么有很多工作可以做。
风飞扬 2025-12-14 02:25:38 互联网大厂面向C端,那地方政府呢,他们会不会有政务方面的自动化需求,私有化部署一下,一些小企业借助成熟方案赚一笔。
私企呢,还是老方法,私有化部署,定制化解决方案,赚一笔。
只要大框架成熟,就跟pytorch库一样,需求能实现,那需求都是在的,钱就会如雨中春笋般冒出来。
而一些老板就会投资,互联网民工就会有岗位,有饭吃,有钱赚。
风飞扬 2025-12-14 02:27:22 但是我觉得成熟不太可能。
就没什么成熟的情况。
就拿文本处理来说,LLM比传统NLP慢、贵。
而高级的一些应用,开源模型又不行,训练又没数据,闭源模型又死贵。
风飞扬 2025-12-14 02:28:11 我现在就有点卡住,用gpt5-high能符合需求,但是贵啊。
用国产模型,我感觉够呛。
风飞扬 2025-12-14 02:28:41 我这还不算什么高级的应用,比豆包AI手机这种简单多了
风飞扬 2025-12-14 02:28:59 豆包AI手机在实际使用的稳定性,还很难说。
风飞扬 2025-12-14 02:31:56 大模型在昙花一现之后,感觉放缓了。
sora确实能生成不错的视频,成本呢。
现在大厂都搞高附加值的东西,比如编程Agent,这种东西可以卖的贵一点。
一些价值不高,但是有用,辽宁舰打蚊子的东西,很不划算。
风飞扬 2025-12-14 02:53:40 字节不太可能开源,我感觉,代码倒是有可能,模型不太好说。
开源一个Agent代码其实意义不是很大。
claude code也能用别的模型,用别的模型就是claude code了?并不是,性能差别很大。
所以,不是Agent的问题。
===
我倒是期待在电脑、手机自动化方面,大厂行行好造点数据,训练一些泛化还不错的模型,至少在一些使用场景上能用,专门为那些场景做优化。
然后,小企业拿来部署部署,给政企客户安排个几百万的订单,我这样的程序员能入职赚个几万块钱。
很通用的小型手机自动化模型是不现实的,gpt5自动化能怎么样,估计一般。
但是为一些场景专门训练,再得到一些泛化能力,是现实的。
例如,将数据从excel表格一条条录入管理系统,操作管理系统进行若干次数据的查询与导出。
===
我之前想过淘宝购物Agent,后来淘宝有AI问答了,但是它现在甚至没办法把商品添加到我的购物车,我明确告诉它了把商品添加到购物车。
我当时没做的原因是,我认为淘宝会做,我认为数据获取难度较高,数据混乱不够清晰,模型能力其实还行,但数据不行导致模型推理的结果不够准确。
结果,淘宝也有这个问题,当你限定价格和具体的产品信息时,例如尺寸、重量、一箱的数量,它就完犊子了,有些东西甚至页面就没写,得问商家的客服。
然后,智谱的宣传视频: AutoGLM开源:每台手机,都可以成为AI手机-哔哩哔哩】 https://b23.tv/7RZSrp2
选的场景还是购物。
我觉得,做好购物这一个就不错了。连淘宝都没做好。淘宝是没用心做。添加到购物车这不是顺手的事儿嘛
===
还有一个扩展思路,商家也可以有Agent,自建一个知识库,用户问过的问题就在里面,那么,当用户的Agent去搜索的时候,直接对接商家的Agent就行了。
===
未来的自动化操作手机,能自己翻商品、看评价、和客服掰扯、获取所有必要信息特别是价格、数量、重量、大小等用户关心的内容,并做出最终购买决定时,这玩意就成功了。
有些东西,用户有需求,但是他不会说,这得根据大数据、用户的历史习惯、模型主动询问,共同实现。
比如,我买点零食和同事一起吃,我的预算是50,那么数量就很重要,假设我分给3~5个人,通常情况下,基本上就是10人以内,我肯定希望买来的零食,分给同事之后,还能剩下80%。
结果模型给了我一个一箱只要20包的零食,这不是扯淡。
或者,夏天我买个大桶冰激凌吃,结果模型给我的商品,到家之后,tmd桶太大,冰箱柜子放不下,这不是扯淡。
所以,问问要分给多少同事,懂得考虑数量,懂得询问用户冰箱多达,以至于根据图片估算冰箱柜子大小,这都是购物Agent的基本能力。
风飞扬 2025-12-14 02:53:55 更不用说货比三家了,字节加油就行了。
风飞扬 2025-12-14 02:55:27 这些东西,用OpenAI的gpt5-high,我相信可以以及其缓慢的速度做到。
不是做不到,只是慢。
而国产模型,做到就很难说了。
风飞扬 2025-12-14 03:01:13 再扩展一下,其实买东西这种事情,和点外卖,做家务一样,以前都是家庭主妇做的事情。
可不要小看了这些事情的难度,一些30岁以上的全职太太这方面有专利般的存在,本质上是一些鸡毛蒜皮的事儿,看上去简单,但是门道不少,模型难以做好。
一旦模型做好了,那么再安装一个身体,机器人保姆也是有可能的。
这些事情的共同点就是,不像训模型写代码,它技术性不强,但吃经验,都是一些照顾人的技术。
帮你做生活上的事儿,本身就是仆人的活。
风飞扬 2025-12-14 03:03:16 这不就相当于清朝时期大户人家的管家一职位,以前这可是正儿八经的岗位。
风飞扬 2025-12-14 03:09:44 我们公司之前有个不成文的规定,谁拖了项目后腿,谁买零食分一分
风飞扬 2025-12-14 03:11:36 后来我养成了一个习惯,下班定闹钟,闹钟响了吃零食,因为还得加班,饿。
弄了两箱零食,一般是上班开始之后下班之前吃一吃,增加幸福感。
风飞扬 2025-12-14 03:13:32 每天的盼头就是下班之后吃口零食。
吃完晚饭又得回到自己蜗居般的出租屋。
偶尔小公园转一转,冷冷的风吹在身上,仿佛嘲讽我那没什么希望的前途。