加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

(2023-07-23 16:31:38)
标签:

康宁杰瑞制药-b

临床数据

锁库

胰腺癌

分类: 个人生物股票
提示:又想点,再把几个胡想的提前铺垫一下(包括前天的那个帖子,所谓提问的“前100个的那些事”),也不知道想干啥,没事折腾。就当娱乐笑话。
一、303入组的数据归类
统计分析的方法,本质上是归纳的方法。统计分析必然是一定量(足量、大量)数据基础上的归纳。对数据的归纳分类也必然是重点。
KN046-303临床入组的大类情况是有了,也就有了统计上的大致分类;但考虑到无法了解到具体入组的细分数据,对于其中个别分段环节存在不确定和歧义,也就对模拟(或者说是逆向)建立的临床模型产生影响。
说白了就是入组数据归类存在多种可能,模拟(或者说是逆向)建立的临床模型也必然会有多种可能。这里就顺便探讨一下:
1、了解到的303临床病人入组情况
KN046-303临床病人入组数量和对应时间段:
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

2022.2.8~6.15入组100例,50例治疗组和50例对照组;
2022.6.16~6.29入组10例,5例治疗组和5例对照组;
2022.6.30~8.28入组100例,50例治疗组和50例对照组;
2022.8.30~12.30入组140例,70例治疗组和70例对照组;
2023.2.1~3.10入组58例,29例治疗组和29例对照组;
这是以时间段作为统计归类的,分为了5个段,这种归类的基础是“各分段内的数据分布是基本相同或存在某种分布规律的”。由于无法了解到各时间段内的入组节奏,也就无法确定各分段内入组随时间的分布规律。由于需要确定各分段的“中位入组时间”这个值,而与各分段内的数据分布规律密切相关。
比如说,如果某分段内(如“2022.6.30~8.28入组100例”,也就是7、8月的入组)入组的节奏是均匀分布,那么“中位入组时间”就是这一时间分段的中间值(就是7月底8月初),而如果分段内(如“2022.6.30~8.28入组100例”)入组的节奏是集中于后半部(如8月),那么“中位入组时间”就是“8月中”。
2、303临床最前入组归类的探讨
可以看出大致了解到的入组数据归类中,两个时间跨度最大的分段(、)由于无法知道相应时间段内的入组节奏,其中位入组时间会有不确定。当然更关键的是正是最前入组的100例这一分段,由于对建立的模型进行关键性验证条件均产生在这一分段中。
这里也就重点探讨一下对最前入组的100例的中位时间以及由此产生的新的归类模型。
假设“最前入组的100例入组是均匀节奏(即均匀分布)”
最前入组的100例入组的中位时间可以基本确定就是这一时间段(2022.2.8~6.15)中间,即大约是4月下旬,在考虑一定偏差基础上,可认定是4月底。
那么其后的那个入组分段,也就是“6.16~6.29入组”的10例从均态分布上考虑,统计上与前后两组都接近,划归到前后任一分段组中都可以。
但是由于在验证条件中涉及到“最前入组100例”这个因素,所以这里将“6.16~6.29入组”的10例划归到后一分段组中。
从统计上的归类可以重新分组为4个
2022.2.8~6.29入组100例,中位时间:2022.4.30;
2022.6.30~8.28入组110例,中位时间:2022.7.30;
2022.8.30~12.30入组140例,中位时间:2022.10.31;
2023.2.1~3.10入组58例,中位时间:2023.2.28;
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾


假设“最前入组的100例入组是集中于4-5月”
最前入组的100例入组的中位时间大约是4月底。
那么其后的那个入组分段,也就是“6.16~6.29入组”的10例从均态分布上考虑,统计上更接近最前这组,则划归到最前面这组中。
从统计上的归类可以重新分组为4个
2022.2.8~6.29入组110例,中位时间:2022.4.30;
2022.6.30~8.28入组100例,中位时间:2022.7.30;
2022.8.30~12.30入组140例,中位时间:2022.10.31;
2023.2.1~3.10入组58例,中位时间:2023.2.28;
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾


二、构建对照组生存率大致模型
由于303临床中对照组采取的是通行的标准治疗方式,其治疗疗效经过多年积累和探索,大致的治疗情况是确定的。而且随着这些年来各种针对胰腺癌晚期的新药临床探索中,积累的相关数据也基本勾画出相应生存率的公认的大致形态。
1、胰腺癌晚期标准治疗下的生存率曲线
这里是指由于胰腺癌晚期标准治疗下的生存率曲线大致的形状和趋势,并不是指精确的生存率数值。
不妨参考一下几个相关胰腺癌标准治疗的生存率的大致形态和曲线样式:
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

以及截取标准治疗下的4个月-15个月的生存率曲线
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

2、模拟胰腺癌晚期标准治疗的生存率曲线形态
同样,这里只是模拟出对照组(也就是胰腺癌晚期标准治疗)的生存率大致的曲线样式,大致的曲线形态。考虑到303临床入组实际条件以及参照其它临床参数,主要参数值是治疗6个月、9个月、12个月的生存率(死亡率),如图:
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

注意,这里是建立可能的理想状态下的标准治疗下的生存率曲线形态,而真实临床中受到各种因素影响,如实际进展中的删失处理等,曲线及形态肯定不会如此平滑。
3、进行大致的曲线过滤
有了大致的对照组生存率曲线样式,就可以对模拟建立的临床模型进行筛选过滤,将众多模拟的模型组合中对照组生存率曲线形态偏差大的过滤去除,这也是筛选手段之一。或者说,模拟构建的逆向模型组合时,对照组的生存率形态必须大致符合标准模型。
这里简单看一个模拟的可能模型,但仅符合验证条件中的部分:
纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾

这一模型推算出的进展数据结果,只是符合部分验证条件;

更多的模型数据及图表将在后面帖子中慢慢折腾……

在验证条件的限定下,满足的越多,对照组和治疗组生存率曲线形态也就大致框定范围,似乎满足手中所有的验证条件时,模拟的治疗组的生存率曲线出现奇怪的趋势……
这里下一个帖子专门娱乐:要么将面临某种极限结果;要么是模型错了,也就是构建模型底层条件有错,如果这样,就只能说明:故事大,事故也大了……

纯属胡说:KN046-303入组的数据分类和生存率曲线形态的折腾


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有