pagedattention学习笔记

paged_attention算是vllm最核心的部分了,之前有看过,再结合具体代码复习一下,顺便看看llama3,有机会可以把这个引入自己的项目里包装下

参考资料

代码:python代码傻子都能看得懂

知乎:写的不赖


pagedattention学习笔记
http://zzsy.me/2025/02/28/pagedattention学习笔记/
作者
yuanyuan
发布于
2025年2月28日
更新于
2025年7月15日
许可协议