Softmax可以说是做分类问题的标配,无论是自然语言、图像,还是其它问题。
Softmax做2分类问题时,本质上和sigmoid没有区别,只是增加了一些参数
神经网络建模分类问题的套路: 稀疏特征 + 词向量 + 隐层 + Softmax