吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 844|回复: 14
收起左侧

[经验求助] 求关于大模型的一些基础知识,只要是关于大模型的知识都OK!!!

  [复制链接]
Wud1 发表于 2024-6-25 23:34
200吾爱币
如题:

     想学习一下大模型的知识点,但是是零基础,所以求一些关于大模型的资料就可以了,让我了解这个模型是什么,能解决一些什么问题就行。
     因为在网上查的资料都太笼统了,不好入门,感谢感谢。。。

最佳答案

查看完整内容

1、【清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战 https://www.bilibili.com/video/BV1UG411p7zv/?p=6&vd_source=3b10e4b0bd948daf6ffe9a00dff628a2 2、大模型全套基本概念等等(这个网站有大模型的主要分支与方向) https://www.aigc.cn/large-models 3、大模型开发入门必读资料(非常详细) https://blog.csdn.net/leah126/article/details/139197017 4、面向开发者的大模型手册 - LLM Cookbook(这 ...

免费评分

参与人数 1吾爱币 +1 收起 理由
munuan4194 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

shuisanyue 发表于 2024-6-25 23:34
1、【清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战
https://www.bilibili.com/video/BV1UG411p7zv/?p=6&vd_source=3b10e4b0bd948daf6ffe9a00dff628a2

2、大模型全套基本概念等等(这个网站有大模型的主要分支与方向)
https://www.aigc.cn/large-models

3、大模型开发入门必读资料(非常详细)
https://blog.csdn.net/leah126/article/details/139197017

4、面向开发者的大模型手册 - LLM Cookbook(这个是github源码和全套资料)
https://github.com/datawhalechina/llm-cookbook

楼主几个够看一段时间了。

满意请采纳啊
pxhzai 发表于 2024-6-26 04:41
除了楼上的,你还可以问ai,给你个免费好用的ai,通义千问。
https://tongyi.aliyun.com/qianwe ... .0.0.40f73da2RcS8DX


大模型,又称作大型模型或基础模型(Foundation Model),是指在人工智能领域中具有极为庞大参数量和复杂结构的机器学习模型。这些模型通常构建在深度神经网络的基础之上,参数数量可达数十亿乃至数万亿之巨。大模型的设计目标是为了增强模型的表达能力与预测性能,使之能应对更为复杂的数据处理任务和应用场景。

### 特点:
1. **参数规模巨大**:大模型的参数量远超传统模型,可以是数百万至数万亿参数,这使得它们能够学习到数据中的细微模式和复杂关系。
2. **复杂计算结构**:伴随着参数量的增加,大模型的架构也更为复杂,通常涉及深层次的神经网络设计。
3. **强大的泛化能力**:通过在大规模数据集上的训练,大模型能够学习到广泛的背景知识,从而对新的、未见过的数据展现出良好的泛化性能。
4. **应用广泛**:适用于多种复杂领域,如自然语言处理(NLP)、计算机视觉(CV)、语音识别、推荐系统等。
5. **资源密集**:大模型的训练和部署需要大量的计算资源、存储空间以及高效的分布式计算技术。
6. **预训练与微调**:常见做法是先在大规模无标注数据上进行预训练,然后针对特定任务进行微调,这样可以显著提升模型在特定任务上的效果并减少对标注数据的依赖。

### 发展历程简述:
- **萌芽期**:从1950年至2005年左右,以卷积神经网络(CNN)等为代表的传统神经网络模型开始发展。
- **快速发展期**:近年来,随着计算能力的飞跃和大数据的积累,大模型的发展进入快车道,涌现出如GPT系列、BERT、T5、CLIP等知名大模型。

### 实例:
如OpenAI的GPT-3,拥有1.75万亿参数,展示了在文本生成、自然语言理解等任务上的卓越性能,是大模型应用的标志性案例之一。

总之,大模型代表了当前人工智能技术追求更高智能水平、更强通用性和适应性的一个重要方向。
freesaber 发表于 2024-6-26 08:44
国产的几个,百度、讯飞的不开会员限制输入长度。阿里的通义,感觉也一般般。deepseek,这个国产是我用过最好的一个,热度没有其他几个高。注册了就能用:https://chat.deepseek.com/coder
freesaber 发表于 2024-6-26 08:46
freesaber 发表于 2024-6-26 08:44
国产的几个,百度、讯飞的不开会员限制输入长度。阿里的通义,感觉也一般般。deepseek,这个国产是我用过最 ...

如何理解:但丁是意大利人,但丁真是中国人。网上有弱智吧问题测试ai的,deepseek使用体验上超过3.5的水平了
 楼主| Wud1 发表于 2024-6-26 15:07
shuisanyue 发表于 2024-6-26 00:15
1、【清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战
https://www.bilibili.com/video/BV1UG ...

大哥,就是还有其他的教程吗?
shuisanyue 发表于 2024-6-26 15:27
Wud1 发表于 2024-6-26 15:07
大哥,就是还有其他的教程吗?

本地部署开源大模型的完整教程,这个是腾讯云的
https://cloud.tencent.com/developer/article/2322954




shuisanyue 发表于 2024-6-26 15:31
Wud1 发表于 2024-6-26 15:07
大哥,就是还有其他的教程吗?

没有验证的:
【贪心科技】大模型微调实战营-应用篇 - 带源码课件
https://pan.quark.cn/s/05c96b615ac5#/list/share
shuisanyue 发表于 2024-6-26 15:33
Wud1 发表于 2024-6-26 15:07
大哥,就是还有其他的教程吗?

没有验证:
ChatGPT大模型,技术场景与商业应用(2024)
https://pan.baidu.com/s/1epa_Aas9RYPoo7rUmVcEDw 提取码: srw7
shuisanyue 发表于 2024-6-26 15:36
Wud1 发表于 2024-6-26 15:07
大哥,就是还有其他的教程吗?

没有验证:
GPT大模型部署使用AIGC实战落地方案


https://pan.quark.cn/s/247cbc13b030#/list/share
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-15 15:37

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表