多模态大模型MLLM学习笔记——持续更新

ViT + Connector + LLM：多模态大模型主流架构介绍：从 LLaVA 到 Qwen3-VL，解构多模态大模型的演进之路 - 我要吃鸡腿的文章 - 知乎 https://zhuanlan.zhihu.com/p/1963658684765833212 MLLM 的“眼睛” (ViT)

概率分布函数和 softmax方法

概率分布函数与 Softmax 方法详解一、概率分布函数 (Probability Distribution Function) 定义概率分布函数是描述随机变量取值概率规律的数学函数。它定义了随机变量取特定值或落入特定区间的可能性。核心类型

transformer如何成为今天AI的地基？ transformer是怎么工作的：

三种归一化方法总览归一化/标准化/正则化归一化：就是将训练集中某一列数值特征（假设是第 i ii 列）的值缩放到0和1，之间。稳定输入分布，减缓梯度消失 <

各种发展与微调的导视小白也能读懂的AIGC扩散（Diffusion）模型系列讲解理解扩散模型的损失函数

Self-attention 总览图：编码器（Encoder