介绍一下大语言模型 (水一篇)

今年基于大语言模型(LLM)的 AI 开始火了起来。但国外许多大语言模型的使用对国内很不友好。

(一般都是限制访问或是收费,重点是,收费吧,还需要国外信用卡支付,这就是卡脖子么?另外,后来官方渠道上用于模型训练的显卡也不向中国供应了...)

自 3 月份 ChatGPT 3.5 发布,算是彻底引爆了基于大语言模型的人工智能行业。
而自 5 月份以后,国内的大语言模型也开始大量涌现。

国内免费

比较有代表的包括但不限于

  1. 百度一言 (https://yiyan.baidu.com/)
  2. 通义千问 (https://qianwen.aliyun.com/)
  3. 讯飞星火 (https://xinghuo.xfyun.cn/)
  4. 字节跳动 豆包 (https://www.doubao.com/)
  5. 腾讯混元 (https://hunyuan.tencent.com/)
  6. 百川智能 (https://www.baichuan-ai.com/)
    ...
    还有很多,大家可以自行搜索

国外服务

而国外知名的,包括但不限于

  1. ChatGPT (业内的标杆,今天 AI 的引爆点)
  2. Claude (通过 Slack 可以免费使用)
    ...

开源项目

除了这些直接可以使用的服务之外,在开源社区中,还有很多教研或个人组织,发布了许多也很优秀的大语言模型的开源实现。比如:

  1. LLaMA 由 meta 开源 官方 Github 论文
  2. ChatGLM - 6B 官网 官方 Github
  3. Alpaca 由 stanford 开源 官方 Github 论文
    ...

常常,每个新的大语言模型出现之后,大家也会与国外的 ChatGPT 进行对比。

以上,是我对国内外大语言模型的一个简单介绍。更多关于大语言模型的应用、分类、以及技术方面的细节,请朋友们在网上自行搜索,当然,如果有一个大语言模型的助手,你也可以通过向"他/她"提问,也能得到一些您想了解的。

下一篇文章,《手摸手教你在本地搭建一个 AI Chat》。

参考

赞赏