Skip to content

Latest commit

 

History

History
67 lines (34 loc) · 3.82 KB

2024-02-02.md

File metadata and controls

67 lines (34 loc) · 3.82 KB

1.大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」

1) 预训练模型的参数,尤其是千亿级别模型的参数,通常不会开源。

2) 更重要的是,预训练模型的输出和参数都会随着 SFT、RLHF、continue pretraining 等下游处理步骤而变化。这使得无论是基于模型输出还是基于模型参数,都很难判断某一模型是否是基于另一现有模型微调得来。

因此,对大模型参数的保护是一个尚缺乏有效解决方案的全新问题。

论文下载地址:https://arxiv.org/pdf/2312.04828.pdf

2.阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作

会操纵手机的智能体,又迎来了全新升级!

新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。

比如根据指示,它可以自行搜索篮球比赛的结果,然后根据赛况在备忘录中撰写文稿。

来自阿里的一篇最新论文,展示了全新手机操纵智能体框架Mobile-Agent,可以玩转10款应用,还能跨越APP完成用户交给的任务,而且即插即用无需训练。

依托多模态大模型,整个操纵过程完全基于视觉能力实现,不再需要给APP编写XML操作文档。

GitHub主页: https://github.com/X-PLUG/MobilAgent

论文地址: https://arxiv.org/abs/2401.16158

3.2023 年是 AI 视频元年,2024 年还有这些难题需要解决

这是 A16Z 合伙人 Justine Moore 最新发布的 2024 年 AI 视频展望。Justine 提到,2023 年对于 AI 视频领域来说,是突破性的一年。

2023 年初时,公开的文本转视频模型尚不存在。仅仅 12 个月后,数十种视频生成产品已被积极使用,全球有数百万用户通过文本或图像提示创建短片。

这些产品仍然有相对的局限性——大多数生成的视频时长为 3~4 秒,输出的质量参差不齐,像角色一致性这样的问题还未得到解决。我们距离用单一文本提示(或甚至多个提示!)创造出皮克斯级别的短片还有很长的路要走。

Reference:https://a16z.com/why-2023-was-ai-videos-breakout-year-and-what-to-expect-in-2024/

4.比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步

商汤一下子把多模态大模型的发展进度条,快进到了落地阶段。

商汤的大模型体系「日日新 SenseNova」今天刚刚发布了 4.0 版,不论语言能力还是文生图能力都有全面升级,还自带低门槛的落地工具。

新一代 SenseNova 不仅在大语言模型、文生图模型等方面进行了重大升级,部分垂直领域能力超越 GPT-4,还发布了全新多模态大模型,并面向数据分析、医疗等场景提供了全新版本,让大模型通用能力适配到了更多领域。

API 申请网址:https://platform.sensenova.cn/

5.惊!1元竟能驱动170万次AI推理?面壁智能MiniCPM 2B大模型:颠覆你的想象,让老手机秒变AI神器!

在科技日新月异的今天,我们似乎习惯了“更新换代”的节奏。但你有没有想过,那些陪伴我们多年的老手机,也能摇身一变成为AI神器?面壁智能的MiniCPM 2B大模型,就给我们带来了这样的惊喜。

你可能不知道,这个仅有20亿参数的大模型,却拥有“越级打怪”的实力。与业内知名的大模型相比,它在多项主流评测中都展现出了优越的性能。更令人振奋的是,它的成本极低,仅需1元就能驱动170万次AI推理!

https://zhuanlan.zhihu.com/p/681201506

6.更新后的GPT-3.5 Turbo上线,降低50%的输入定价

https://twitter.com/OfficialLoganK/status/1753122474597011958?s=20

7.如何借助AI生成红包封面

演示环境:https://aicover.design

项目源码:https://github.com/all-in-aigc/aicover