多模态大模型MLLM学习笔记——持续更新

ViT + Connector + LLM: 多模态大模型主流架构介绍:从 LLaVA 到 Qwen3-VL,解构多模态大模型的演进之路 - 我要吃鸡腿的文章 - 知乎 https://zhuanlan.zhihu.com/p/1963658684765833212 MLLM 的“眼睛” (ViT)


概率分布函数 和 softmax方法

概率分布函数与 Softmax 方法详解 一、概率分布函数 (Probability Distribution Function) 定义 概率分布函数是描述随机变量取值概率规律的数学函数。它定义了随机变量取特定值或落入特定区间的可能性。 核心类型


BN/LN/IN/GN 归一化

三种归一化方法总览 归一化/标准化/正则化 归一化:就是将训练集中某一列数值特征(假设是第 i ii 列)的值缩放到0和1,之间。 稳定输入分布,减缓梯度消失 <