1.大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
1) 预训练模型的参数,尤其是千亿级别模型的参数,通常不会开源。
2) 更重要的是,预训练模型的输出和参数都会随着 SFT、RLHF、continue pretraining 等下游处理步骤而变化。这使得无论是基于模型输出还是基于模型参数,都很难判断某一模型是否是基于另一现有模型微调得来。
因此,对大模型参数的保护是一个尚缺乏有效解决方案的全新问题。
论文下载地址:https://arxiv.org/pdf/2312.04828.pdf
2.阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
会操纵手机的智能体,又迎来了全新升级!
新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。
比如根据指示,它可以自行搜索篮球比赛的结果,然后根据赛况在备忘录中撰写文稿。
来自阿里的一篇最新论文,展示了全新手机操纵智能体框架Mobile-Agent,可以玩转10款应用,还能跨越APP完成用户交给的任务,而且即插即用无需训练。
依托多模态大模型,整个操纵过程完全基于视觉能力实现,不再需要给APP编写XML操作文档。
GitHub主页: https://github.com/X-PLUG/MobilAgent
论文地址: https://arxiv.org/abs/2401.16158
3.2023 年是 AI 视频元年,2024 年还有这些难题需要解决
这是 A16Z 合伙人 Justine Moore 最新发布的 2024 年 AI 视频展望。Justine 提到,2023 年对于 AI 视频领域来说,是突破性的一年。
2023 年初时,公开的文本转视频模型尚不存在。仅仅 12 个月后,数十种视频生成产品已被积极使用,全球有数百万用户通过文本或图像提示创建短片。
这些产品仍然有相对的局限性——大多数生成的视频时长为 3~4 秒,输出的质量参差不齐,像角色一致性这样的问题还未得到解决。我们距离用单一文本提示(或甚至多个提示!)创造出皮克斯级别的短片还有很长的路要走。
Reference:https://a16z.com/why-2023-was-ai-videos-breakout-year-and-what-to-expect-in-2024/
4.比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步
商汤一下子把多模态大模型的发展进度条,快进到了落地阶段。
商汤的大模型体系「日日新 SenseNova」今天刚刚发布了 4.0 版,不论语言能力还是文生图能力都有全面升级,还自带低门槛的落地工具。
新一代 SenseNova 不仅在大语言模型、文生图模型等方面进行了重大升级,部分垂直领域能力超越 GPT-4,还发布了全新多模态大模型,并面向数据分析、医疗等场景提供了全新版本,让大模型通用能力适配到了更多领域。
API 申请网址:https://platform.sensenova.cn/
5.惊!1元竟能驱动170万次AI推理?面壁智能MiniCPM 2B大模型:颠覆你的想象,让老手机秒变AI神器!
在科技日新月异的今天,我们似乎习惯了“更新换代”的节奏。但你有没有想过,那些陪伴我们多年的老手机,也能摇身一变成为AI神器?面壁智能的MiniCPM 2B大模型,就给我们带来了这样的惊喜。
你可能不知道,这个仅有20亿参数的大模型,却拥有“越级打怪”的实力。与业内知名的大模型相比,它在多项主流评测中都展现出了优越的性能。更令人振奋的是,它的成本极低,仅需1元就能驱动170万次AI推理!
https://zhuanlan.zhihu.com/p/681201506
6.更新后的GPT-3.5 Turbo上线,降低50%的输入定价
https://twitter.com/OfficialLoganK/status/1753122474597011958?s=20
7.如何借助AI生成红包封面