(202312)so-large-lm:Task01引言

news/2024/7/5 7:13:08

文章目录

  • 前言
  • 要点总结
    • 1 什么是语言模型
    • 2 大模型相关历史回顾
    • 3 这门课的意义
    • 4 课程结构介绍

前言

感谢开源学习的组织者与活动的发起者为我们带来so-large-llm这一可谓大语言模型的通识课。原项目地址为so-large-lm。

要点总结

基础比较烂,所以我会用我能理解,也就是大多数人能理解的方式通俗阐述。如果有什么过于离谱而文盲的解释或类比,请你随便指出。

1 什么是语言模型

  • 语言模型其实是序列的概率分布,大概也就是通过对一段散开的字词进行排列,然后展现出出现概率最大的一种。
  • 试想现在这个模型的词库很大,那么它就有可能给出很多符合常理的句子;但是这些句子是不需要的,我们现在在已经具有一小段序列的情况下只筛选出其中一部分字词,然后再在这些选择出的字词中进一步选择,就减少了计算量而出现了更合理并且语义明确的序列。
  • 温度可以控制生成中的变异量;这个词语还挺形象的。用分子动理论来类比的话就像是升高温度后整个气体变得更活跃了,更能出现奇怪的组合。

2 大模型相关历史回顾

  • 大模型的熵:熵实际上是一个衡量将样本 x ∼ p x∼p xp 编码(即压缩)成比特串所需要的预期比特数的度量。熵的值越小,表明序列的结构性越强,编码的长度就越短。直观上是符合心理的(因为不懂信息学,只能这么说TAT)。
  • N-gram模型:预测依赖于最后的n-1个字符,已经是有那味了。2007年Brants等在2万亿个tokens上训练了一个5-gram模型用于机器翻译。
  • 神经语言模型:有两个关键发展,循环神经网络(RNN)和Transformer架构。目前后者可以说是LLM发展到这样的大功臣。
  • LLM发展和算力的发展是分不开的。

3 这门课的意义

技术层面上本课专注于自回归语言模型。
应对广泛的应用领域以及对于大模型快速发展所产生一些问题的担忧。

4 课程结构介绍

分为四个层次

  1. LLM对于我们是黑盒子,只是通过API进行访问,理解其行为
  2. 从训练数据的角度来了解大模型以及思考关于其中的道德与法律的问题
  3. 学习如何构建大语言模型,学习其模型架构和算法
  4. 按照这种思维去思考这种方法的扩展,引向多模态大模型。

http://lihuaxi.xjx100.cn/news/1888530.html

相关文章

基于Spring Boot、Mybatis、Redis和Layui的企业电子招投标系统源码实现与立项流程

招投标管理系统是一款适用于招标代理、政府采购、企业采购和工程交易等领域的企业级应用平台。该平台以项目为主线,从项目立项到项目归档,实现了全流程的高效沟通和协作。通过该平台,用户可以实时共享项目数据信息,实现规范化管理…

小航助学2023年9月电子学会Scratch一级真题(含题库答题软件账号)

需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统(含题库答题软件账号) 单选题2.00分 删除编辑附件图文 答案:C 第1题下列哪项内容是不可以修改的?( ) A、角色名称B、造型名称C、舞台名称D、背景名…

Buck电路 (PWM实现与闭环反馈) 电力系统仿真

Buck电路 (PWM实现与闭环反馈) Buck电路是降压型的DC-DC变换器。 三角波: 闭环控制怎么实现呢? 比例积分微分控制(proportional-integral-derivative control),简称PID控制,是最早…

Python print() 函数的高级用法探究

更多资料获取 📚 个人网站:ipengtao.com Python中的print()函数是我们在日常编程中使用频率极高的一个工具,然而,很多人可能只是简单地用它来打印一些变量或文本。本文将深入探讨print()函数的高级用法,包括格式化输出…

跨境电商如何利用跨境客服软件提升销售额

随着全球化的推进,跨境电商成为了许多企业拓展市场的重要途径。然而,跨境电商面临着语言、文化、时差等多种挑战,为了提供更好的客户服务并提升销售额,跨境电商需要利用跨境客服软件。本文将探讨跨境电商如何利用跨境客服软件来提…

R2O语义分割: Refine and Represent: Region-to-Object Representation Learning

paper: arxiv.org/pdf/2208.11821v2.pdf repo link: KKallidromitis/r2o: PyTorch implementation of Refine and Represent: Region-to-Object Representation Learning. (github.com) 摘要: 在本文中提出了区域到对象表示学习(Region-to-Object Rep…

腾讯云:AI云探索之路

随着科技的飞速发展,人工智能(AI)云计算领域日益显现出其巨大的潜力和价值。在这个充满挑战和机遇的领域,腾讯云凭借其卓越的技术和创新能力,取得了令人瞩目的成果。本文将深入探讨腾讯云在AI云计算领域的优势,以及其为人工智能发…

JavaScript——基本语法

1.定义变量&#xff1a; 变量类型 变量名 变量值 var关键字声明变量 es6版本以上 var 可写可不写 <script>// 定义变量&#xff1a;变量类型 变量名 变量值 var关键字声明变量 es6版本以上 var 可写可不写var num 2;</script>2.条件控制 <script>var …