海归网首页   海归宣言   导航   博客   广告位价格  
海归论坛首页 会员列表 
收 藏 夹 
论坛帮助 
登录 | 登录并检查站内短信 | 个人设置 论坛首页 |  排行榜  |  在线私聊 |  专题 | 版规 | 搜索  | RSS  | 注册 | 活动日历
主题: [转帖]数学家们在统计学领域犯下了几个严重的错误
回复主题   printer-friendly view    海归论坛首页 -> 海归商务           焦点讨论 | 精华区 | 嘉宾沙龙 | 白领丽人沙龙
  阅读上一个主题 :: 阅读下一个主题
作者 [转帖]数学家们在统计学领域犯下了几个严重的错误   
HHH





头衔: 海归中尉
声望: 学员

加入时间: 2012/07/29
文章: 228

海归分: 4227





文章标题: [转帖]数学家们在统计学领域犯下了几个严重的错误 (2628 reads)      时间: 2012-8-28 周二, 10:35   

作者:HHH海归商务 发贴, 来自【海归网】 http://www.haiguinet.com

数学家们在统计学领域犯下了几个严重的错误

稳健回归的开创者、美国著名的统计学家、前美国总统科技顾问Peter John Huber于1997年11月在北京中国科学院数理统计研究所演讲时说道:“很多数学背景的统计学家们在统计学领域犯下了严重的错误,导致了很多思想和方法上的混乱。”他并期待着一股来自数学以外的力量能够推动统计学和数学的变革。
听到这个演讲内容和观点后,我的第一感觉是,如果这个力量存在的话,那么,它只能是哲学,因为哲学是人类一切知识的认识论和方法论根源,因而也是一切知识的终极裁决者。
一个学统计的,如果不懂哲学,便如一个在黑暗中摸索的瞎子。对于在黑暗中感到困顿的人,哲学将会开启他的智慧,并赋予他一盏明亮的灯,照亮他前进的道路。
最近试图与几位著名的数学背景的统计学家交流自己的思想,但无一愿意给出有价值的东西,他们基本采取了沉默不语或不屑理睬的态度。为此,我把试图与他们交流的东西发表在自己的博客里,作为对整个系统的挑战。这个挑战将一直存在于这里,以便人们可以观瞻这一科学史上的悲剧。

Dear Dr. XXX,

您能够解答我的以下两个困惑吗?
我在长达近14年多的时间里做的是关于临界回归分析或分段回归分析(segmented regression or piecewise regression)的逻辑与算法的重建。我之所以坚持不懈地这样做,是因为我相信没有一套数学公理系统可以演绎出这个方法论,而当前的方法论存在严重的理论错误。这个领域里最困扰我的问题有以下两个:
第一,在基于样本测量的基础上在样本可测空间上搜索未知临界点时,目前的经典方法论是以随机分段模型组中最小合并预测残差(min(combined residuals))作出一组“最优”的模型决策,也就是所谓的最优化决策。我想请问,这个决策的数学根据是什么?谁已经或能够从概率论上证明那个最小合并预测残差与所谓的“最优临界模型组”的随机参数集合之间的对应是一个“可期望的”或“可靠的”对应,或者说,上述两个随机测度的收敛在各自的可测空间上具有概率上最大且充分的一致性。
我从直觉上看这个对应是不可期望的,因为无论是最小合并预测残差,还是对应于它的随机临界模型组的各个统计量都是随机的“点”测量,它们之间的对应关系就好比我们在一定的样本量条件下得到的一组同质人群的身高与体重之间的随机的点对应一样。如果我们的研究目的是试图用“身高”这个随机变量来对“体重”这个随机变量的某个属性做出统计决策,我们显然是不可能使用min(身高)或max(身高)来做出一个关于“体重”的那个属性的稳定而可靠的决策的。这样的“最优化”在统计学上是绝对不可接受的,因为,If we could use min(X) or max(X) to make a statistical decision for Y, where both X (maybe an optimizer) and Y (maybe a set of parameters of a set of threshold models) are randomly variable, then all the fundamentals of Statistics would be collapsed.
第二,关于spline技术在临界回归分析中的应用。这里有一个前提假设,即所谓的enforced continuity,这个假设是以数学函数理论求解临界点的关键条件。没有这个假设的给定,就无法使用解联立方程组的方法求解未知临界点。但是,从统计学的角度,如果一个总体中存在一个临界点,那么,在随机抽样的条件下,在样本临界点(如果它可以被以另外的方法估计出来的话)附近的两个临界模型间将必然存在一个抽样的连接变异(这是一个确定性的存在),至于这个连接变异有多大多小,nobody knows(也即这是一个非确定性的存在),从而,我们不可以强制性地预设那个“连续性”来建立一套方法论。反之,如果坚持采用那个强制连续性的假设,就等于是用一个确定性的假设来否决了一个确定性的存在,并以假定的方式肯定了一个非确定性的不存在(非确定性的连接变异 = 0,即肯定了“非确定性的连接变异”的不存在)!这是一个令人惊叹的低级错误。
If the continuity between two adjacent threshold models is not inferred in a probability, it is not a statistical method but a mathematical game with an arbitrary assumption in a certainty for an uncertainty.
所以,我认为以上两个问题可能是统计学方法论发展史上的两个悲剧性错误。我在2007年和2009年的JSM会议上曾两次谈到了这两个错误,也曾试图投稿发表自己的见解,却被所有杂志社拒绝了,但却从来没有人对这类拒绝的理由给出任何专业方面的解释。
上述两个问题我曾请教过哈佛统计系的主任孟晓犁(Xiao-Li Meng)以及当前的Annals of Statistics的副主编蔡天文(Tong Cai),然而,这两位杰出的数学背景的统计学家无一愿意回应。所以,那两个困惑对于我依然待解,我相信没有哪个数学背景的数理统计学家可以给出关于它们的肯定的论证,因为它们本是统计学领域的两个谬论,是由于概念缺失导致的分析逻辑和数学算法上的错误。
人们可以继续无视我所做出的东西,因为作为国内医学院毕业的master-level的我在统计学领域的credit可以被忽略不计,但问题将依然存在。正如Dr. Huber所指出的那样,“一些数学家习惯于以他们的确定性思维模式来解决非确定性领域的问题”,这是统计学领域中一切错误和问题的根源所在。

https://blog.wenxuecity.com/myblog/48015/201208/17751.html

作者:HHH海归商务 发贴, 来自【海归网】 http://www.haiguinet.com









相关主题
【数字说话帖】《中医药统计摘编》给我们传达了什么信息 ZT (保留一天,供... 海归酒吧 2007-8-14 周二, 13:06
桀骜慧黠的林岚岚蕖研究员在深邃繁复的强激光非线性超快光子晶体物理学领域新颖... 海归文集候选文章 2012-4-03 周二, 00:33
上海新编中学历史教材刻意隐瞒历史错误 - - zt 海归论坛 2006-11-05 周日, 09:41
Do we work on these: ZT: 美国《科学》杂志预计8个... 海归论坛 2005-12-31 周六, 00:28
密码学领域重大发现:山东大学王小云教授成功破解MD5(ZT) 海归论坛 2004-9-08 周三, 06:27
[转帖]中4次大奖 斯坦福统计学女博士摸透彩票规律 海归茶馆 2011-8-11 周四, 07:32
[转帖]真学真修 严于律己 生活风情 2016-5-16 周一, 19:10
[转帖]统计显示中国人吸烟状况更为严峻 石英 【愿海归网上的烟民戒烟!】 海归主坛 2016-1-01 周五, 11:34

返回顶端
阅读会员资料 HHH离线  发送站内短信
  • [转帖]数学家们在统计学领域犯下了几个严重的错误 -- HHH - (2565 Byte) 2012-8-28 周二, 10:35 (2628 reads)
显示文章:     
回复主题   printer-friendly view    海归论坛首页 -> 海归商务           焦点讨论 | 精华区 | 嘉宾沙龙 | 白领丽人沙龙 所有的时间均为 北京时间


 
论坛转跳:   
不能在本论坛发表新主题, 不能回复主题, 不能编辑自己的文章, 不能删除自己的文章, 不能发表投票, 您 不可以 发表活动帖子在本论坛, 不能添加附件不能下载文件, 
   热门标签 更多...
   论坛精华荟萃 更多...
   博客热门文章 更多...


海归网二次开发,based on phpbb
Copyright © 2005-2024 Haiguinet.com. All rights reserved.