MobileSideBar

SEARCH

MENU

  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档

CATEGORIES

  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

NEWPOSTS

  • n个正态随机数的最大值的渐近估计
  • 流形上的最速下降:5. 对偶梯度下降
  • 低精度Attention可能存在有...
  • MuP之上:1. 好模型的三个特征
  • 随机矩阵的谱范数的快速估计
  • DiVeQ:一种非常简洁的VQ训练方案
  • 为什么线性注意力要加Short C...
  • AdamW的Weight RMS的...
  • 重新思考学习率与Batch Siz...
  • 重新思考学习率与Batch Siz...

COMMENTS

  • danyao12: "理想的根治办法是Stochastic Rounding,也就...
  • wade: 那公式18,是缺少了,$-\frac{1}{2} \left ...
  • wade: 那公式18,是缺少了,$-\frac{1}{2} \left ...
  • 李双良: 你好,公式23中分母的H对角线元素求和的因子为什么只有(1−β...
  • ljj: 博主您好,我在您的另一篇文章中(https://spaces....
  • Hsichen: 文中有一句话“TTT的想法是:设计一个模型$v=f(S_t;k...
  • liuy: 比如2021年Facebook提出了BASE Layer。请问...
  • 大川: 请问,如果输入的序列向量是通过BERT抽取得到的,而在BERT...
  • 凯莱: 式(17)太精彩了,这是数学中常用的技巧吗?
  • tianshu_wu: Sorry,写错了,如果向量倾向于共线,应该是内积大,倾向于正...

USERLOGIN

  • 登录
科学空间|Scientific Spaces
  • 登录
  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档
渴望成为一个小飞侠

  • 欢迎订阅

  • 个性邮箱

  • 天象信息

  • 观测ISS

  • LaTeX

  • 关于博主

欢迎访问“科学空间”,这里将与您共同探讨自然科学,回味人生百态;也期待大家的分享~

  • 千奇百怪Everything
  • 天文探索Astronomy
  • 数学研究Mathematics
  • 物理化学Phy-chem
  • 信息时代Big-Data
  • 生物自然Biology
  • 图片摄影Photograph
  • 问题百科Questions
  • 生活/情感Life-Feeling
  • 资源共享Resources
  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

链接

  • Cool Papers
  • 数学研发
  • Seatop
  • Xiaoxia
  • 积分表-网络版
  • 丝路博傲
  • 数学之家
  • 有趣天文奇观
  • TwistedW
  • godweiyang
  • AI柠檬
  • 王登科-DK博客
  • ESON
  • 枫之羽
  • Mathor's blog
  • coding-zuo
  • 博科园
  • 孔皮皮的博客
  • 运鹏的博客
  • jiming.site
  • OmegaXYZ
  • EAI猩球
  • 文举的博客
  • 申请链接

科学空间

微信打赏

科学空间

支付宝打赏

因为网站后台对打赏并无记录,因此欢迎在打赏时候备注留言。
你还可以点击这里或在下方评论区留言来告知你的建议或需求。

你也许还对下面的内容感兴趣

  • 线圈感抗和电容容抗的计算
  • “闭门造车”之多模态思路浅谈(二):自回归
  • f-GAN简介:GAN模型的生产车间
  • Project Euler 454 :五天攻下“擂台”
  • 那个屠榜的T5模型,现在可以在中文上玩玩了
  • 【生活杂记】用电饭锅来煮米汤
  • Transformer升级之路:8、长度外推性与位置鲁棒性
  • 《当彩色的声音尝起来是甜的》电子版
  • 【NASA每日一图】超新星遗骸E0102-72
  • 2012年天象
发表你的看法
    1. «
    2. 1
    3. ...
    4. 3
    5. 4
    6. 5
    7. 6
Evan-wyl

October 27th, 2024

Hi, 苏神,我是EAI猩球博客的博主,主要关注具身智能这块,我的博客建立是受到您的影响的,非常希望能够和您的交换友链接。

回复评论
苏剑林 发表于 October 30th, 2024

已加

回复评论
Chaofa Yuan

May 4th, 2025

苏神您好,经常在你的 blog 学习各种知识,非常感谢分享~

希望与苏神交换友链,自己的 blog 运行有 6 年,均为原创内容,以 LLM/NLP 相关内容为主。

站点名称:chaofa用代码打点酱油
站点地址:https://bruceyuan.com
友链:https://bruceyuan.com/link.html

回复评论
苏剑林 发表于 May 11th, 2025

欢迎,已加

回复评论
真锋

August 13th, 2025

苏神您好,经常在你的 blog 学习各种算法和数学知识,虽然经常也会看不懂,但是其中公式推导过程让我印象深刻,感谢您的长达数10年的坚持分享~

我坚持写博客也 快 7 年了,均为原创内容,以 LLM 框架、深度学习基础、cuda/triton相关内容为主。

希望和苏神交换友链,

站点名称:Zhang's blog
站点地址:https://www.armcvai.cn/
友链:https://www.armcvai.cn/

回复评论
苏剑林 发表于 August 16th, 2025

好的,已加

回复评论
mp4网

September 25th, 2025

申请友链
站名:mp4网
域名:http://mp4wang.cc
描述:在线视频

回复评论
    1. «
    2. 1
    3. ...
    4. 3
    5. 4
    6. 5
    7. 6
取消回复

1. 可以使用LaTeX代码,点击“预览效果”可查看效果;
2. 可以通过点击评论楼层编号来引用该楼层;
3. 网站可能会有点卡,如非确认评论失败,请不要重复点击提交。

关于站长

科学空间logo
苏剑林|BoJone,科学空间博主,【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者(但不专业)......目前32岁,还在单调递增。希望能一直在此分享科学之美~
你也许会关心:
  • 科学空间|Scientific Spaces 介绍
  • 科学空间QQ交流群:67729435
  • 科学空间微信交流群:spaces_ac_cn
  • 常见问题集:《科学空间FAQ》
  • 智能搜索

    支持整句搜索!网站自动使用结巴分词进行分词,并结合ngrams排序算法给出合理的搜索结果。

    热门标签

      生成模型 attention 优化 语言模型 模型 网站 概率 梯度 矩阵 转载 优化器 微分方程 分析 天象 深度学习 积分 python 力学 无监督 扩散 几何 节日 生活 文本生成 数论

    随机文章

    • Muon续集:为什么我们选择尝试Muon?
    • 又一道川菜!媲美“开水白菜”的瓜燕穗肚
    • “未解之谜”:为何不讲中点矩形法则?
    • 从牛顿力学角度研究宇宙学
    • 为什么线性注意力要加Short Conv?
    • 一维弹簧的运动(上)
    • 基于量子化假设推导模型的尺度定律(Scaling Law)
    • 旋转的弹簧将如何伸长(2)?
    • 情人节?元宵节!
    • BLOG评论故障修复,部分数据丢失

    最近评论

    • danyao12: "理想的根治办法是Stochastic Rounding,也就是依概率向上/向下舍入,这样最大...
    • wade: 那公式18,是缺少了,$-\frac{1}{2} \left \ u \right \ ...
    • wade: 那公式18,是缺少了,$-\frac{1}{2} \left \ u \right \ ...
    • 李双良: 你好,公式23中分母的H对角线元素求和的因子为什么只有(1−β^2)了,νi^2β^2为什么删...
    • ljj: 博主您好,我在您的另一篇文章中(https://spaces.ac.cn/archives/5...
    • Hsichen: 文中有一句话“TTT的想法是:设计一个模型$v=f(S_t;k)$,然后用这些(k,v)对去“...
    • liuy: 比如2021年Facebook提出了BASE Layer。请问一下这个的效果是很差吗,它给我的...
    • 大川: 请问,如果输入的序列向量是通过BERT抽取得到的,而在BERT中已经添加了位置信息,那么还需要...
    • 凯莱: 式(17)太精彩了,这是数学中常用的技巧吗?
    • tianshu_wu: Sorry,写错了,如果向量倾向于共线,应该是内积大,倾向于正交时内积小

    友情链接

    • Cool Papers
    • 数学研发
    • Seatop
    • Xiaoxia
    • 积分表-网络版
    • 丝路博傲
    • 数学之家
    • 有趣天文奇观
    • TwistedW
    • godweiyang
    • AI柠檬
    • 王登科-DK博客
    • ESON
    • 枫之羽
    • Mathor's blog
    • coding-zuo
    • 博科园
    • 孔皮皮的博客
    • 运鹏的博客
    • jiming.site
    • OmegaXYZ
    • EAI猩球
    • 文举的博客
    • 申请链接

    署名-非商业用途-保持一致 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。
    © 2009-2025 Scientific Spaces. All rights reserved. Theme by laogui. Powered by Typecho. 备案号: 粤ICP备09093259号-1/2。