当你使用20轮的梯度下降选取 α=0.3, 并且每轮计算 J(θ) ,当你发现J(θ)一直上涨时,下面哪些结论看起来靠谱?()
α=0.3 是一个非常好的参数
你可以考虑用一个更大的 α=1.0
你可以考虑用一个更小的 α=0.1