别卷推理了!当前大模型 STEM 短板在视觉感知,代码才是破局关键