Jianghc's Blog

Back

下一代深度学习思考与若干问题#

计算机视觉,从孤立到系统#

更主要的多模态是相对全面的感知,从被动到主动,在探索中去学习 大模型催生人工智能的体系结构,

AI体系结构

  • AI基本能力间的界面
  • AGI的结构支撑,通用人工智能
  • 超越传统AI话题的研究领域
  • 超越单一智能催生结构

模型是什么:算法复杂程度(写代码有多难)* 养成数据 (可能这里是一个对数关系,规模躲不过维数灾难) 模型成熟度:M = 算力(当前能提供的算力)/模型复杂程度
通用模型趋向于简单化,专用模型趋向于复杂化。 Lifelong Learning Machine 操作性条件反射,交互学习,多模态不是简单将文本加进去?自学不仅仅是自监督学习,更多是从观察到探索,

神经网络模型轻量化设计#

较新的问题: 参数矩阵中每连续M个参数中有N个参数为0 自动化的神经网络分析,结构化剪纸 边缘设备傻姑娘的模型部分更新

轻量化VIT,只看Flops是有误导的,attetion并不是在所有的token都做,self-attention会占用到一半左右的时间,

知识蒸馏:

NeRF

机器人具身智能。20230611#

density field是一种更为广泛的表达方式相较与sdf和occ,但也更难训练 高频信号的一些表达,编码,分块来进行表达(每块用一个小的MLP)

Plenoxels暗示了最重要的不是network而是一个可微的渲染,并不是非神经网络不可,神经网络具有连续性和整体性。如何将知识可微化是个可以讨论的topic

VALSE-2023
https://525511.xyz/blog/valse-2023
Author Haochen Jiang
Published at June 10, 2023
Comment seems to stuck. Try to refresh?✨