新闻资讯

美股暴跌之际,DeepSeek发布了新的人工智能模型

美股暴跌之际,DeepSeek发布了新的人工智能模型

  来源:中国基金报

  1月28日凌晨,国内火爆的AI大模型公司DeepSeek称遭受大规模恶意攻击!

  DeepSeek称遭受大规模恶意攻击

  DeepSeek官网的服务状态页面显示:“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。”

  1月20日,DeepSeek推出了AI模型R1,这是一款为解决复杂问题而设计的专用模型。在海外出圈之后,DeepSeek的服务需求激增。DeepSeek表示,最新的AI模型可以与OpenAI的ChatGPT媲美,且开发成本远低于竞争产品。

  这次更新引发了美国和欧洲科技股市值蒸发超过1万亿美元的暴跌,投资者质疑美国一些大公司虚高的估值。

  全球科技股纷纷下跌,英伟达暴跌15%!纳斯达克指数暴跌超3%,该指数以科技股为主。除英伟达外,其他芯片股也在暴跌,博通公司暴跌近17%,台积电暴跌14%,阿斯麦暴跌超6%。

  分析称,DeepSeek推出的低成本人工智能模型可能会使推动牛市的科技估值难以为继。

  Murphy & Sylvest财富管理公司的保罗·诺尔特(Paul Nolte)表示,“我们不知道这是不是股票市场的‘斯普特尼克时刻’,但这肯定是一个警钟,提醒我们并不是市场上唯一的玩家,将极高的估值赋予这些股票,认为它们垄断了市场,这是一个巨大的错误,现在正在被重新评估。”

  对于Miller Tabak的马特·马利(Matt Maley)来说,DeepSeek最新的人工智能模型更具成本效益,并且运行在技术要求较低的芯片上,这引发了对人工智能热潮能带来多大收益的严重质疑。

  DeepSeek火上浇油,发布了新款人工智能模型

  当地时间1月27日, DeepSeek团队正式发布两款多模态框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。

  JanusFlow是一款通过生成流(Rectified Flow)与自回归语言模型融合实现统一的框架。它不仅在理解任务中表现优异,还能生成高质量图像,展现了框架设计的极简与强大。

  北京时间1月28日凌晨,就在美国科技股暴跌之际,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态人工智能模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。

  页面显示,Janus-Pro是一种新颖的自回归框架,统一了多模态的理解与生成。它通过将视觉编码分离为独立的路径,解决了以往方法的局限性,同时仍然采用单一的统一Transformer架构进行处理。视觉编码的分离不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还提升了框架的灵活性。Janus-Pro不仅超越了之前的统一模型,还能匹配或超越任务专用模型的性能。其简单性、高灵活性以及高效性使Janus-Pro成为下一代统一多模态模型的有力候选者。

  Janus-Pro是一款统一理解与生成的多模态大语言模型(MLLM),通过对多模态理解与生成的视觉编码进行解耦来实现功能。Janus-Pro构建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。

  在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入。在图像生成方面,Janus-Pro使用了来源于此的分词器(tokenizer),其下采样率为16。

  • 曝本田和日产开启合并磋商,即将签署谅解备忘录
  • 美国ITC裁定联想智能手机侵犯爱立信专利
  • ST晨鸣:截至2024年12月29日,公司持有有限售条件股份3094万股,主要是董监高的高管锁定股
  • ETF如何实现阳光透明运作和高效率投资
  • 央行今早约谈部分金融机构,强调合规交易,对问题机构零容忍!→ 谁是本轮债牛的推手?每下1BP,都感觉明年更艰难一分
  • 晨星公司:能源股为投资组合增添必要动力
  • 黑猫投诉发布2024年度企业红黑榜榜单
  • 银行逐鹿消费贷:利率低至“2字头” 额度高至百万元
  • 深耕拉美!长城汽车新能源全球化布局加速
  • 国泰君安发行30亿元短期融资券
  • 特朗普团队拟放宽AI监管规则或放开无人驾驶,特斯拉迎重大利好?
  • 贵州茅台王莉:正在全国规划品牌文化体验馆
  • 美股暴跌之际,DeepSeek发布了新的人工智能模型的相关内容

    关键词: