方豫就用袖子里的维尔德溺爱朝着华泽成施展了一个四环的“巧言令色”。
注1:现在的大模型llm指的是大语言模型large language model,主要使用了transformer架构。
llm的概念,在2017年才正式出现。
但书中的橘子大模型,和gpt这种主要依靠注意力机制的transformer架构大语言模型并不一样,而是基于柚子的底层法则而构建的,并由柚子重新开发出对应的神经网络算法搭建而成。因此,这里的大模型指的并非大语言模型,而是指的大参数模型。
方豫就用袖子里的维尔德溺爱朝着华泽成施展了一个四环的“巧言令色”。
注1:现在的大模型llm指的是大语言模型large language model,主要使用了transformer架构。
llm的概念,在2017年才正式出现。
但书中的橘子大模型,和gpt这种主要依靠注意力机制的transformer架构大语言模型并不一样,而是基于柚子的底层法则而构建的,并由柚子重新开发出对应的神经网络算法搭建而成。因此,这里的大模型指的并非大语言模型,而是指的大参数模型。