上期是MPN的入門篇,相信您已經(jīng)領(lǐng)悟了MPN的意義。本期是進階篇,主要告知MPN的數(shù)學原理,就是MPN值是怎么算出來的,可能有點枯燥,但是也很有趣。閱讀進階篇需具備以下數(shù)學基礎(chǔ):高中的排列組合、大學的概率論與數(shù)理統(tǒng)計,以及微積分。
進階篇
入門篇里我們提到了二項式分布,從圖上看,很多人估計都會覺得這像正態(tài)分布。沒錯,僅僅也就是像而已。
我們先來搞明白這幾個隨機變量分布。二項式分布是一個比較簡單的分布,適用于樣品量不大的試驗。如果把樣品量放大,概率變小,那么二項式分布就無限逼近泊松分布了。泊松分布是有限個數(shù)世界里的王者。如果把泊松分布樣品量也無限大,它就會逼近正態(tài)分布,而正態(tài)分布是無限世界的分布。有限個數(shù)和無限個數(shù),是我自己給出的概念,目的是讓你理解。數(shù)學上叫離散型和連續(xù)型。
如果把全球70億人作為樣本,分析某個指標,你覺得應該用什么分布?只能是泊松分布,因為70億雖然很多,但是是有限個數(shù)。數(shù)學就是這么殘酷,70億很大么?毛毛雨啦。
如果想分析數(shù)字0到數(shù)字1之間的某個隨機變量的分布,那才能用到正態(tài)分布。因為0到1之間是連續(xù)的,是可以無限劃分的,只要小數(shù)點后面位數(shù)足夠,它就是無限的?,F(xiàn)在你明白,有限和無限的區(qū)別了吧。
所以我們做微生物數(shù)量分析,雖然微生物數(shù)量動輒幾十億,上百億,但是在數(shù)學面前都是有限的。所以下面的計算只用到了泊松分布和二項式分布。
言歸正傳,MPN法是有兩個假設(shè)前提的。為了方便理解,我們還是以水質(zhì)中大腸檢驗為例。第一,大腸菌在水體中都是以均勻分散狀態(tài)存在的,沒有若干個大腸菌結(jié)成一團的情況(知道為啥樣品要均質(zhì)了吧)。第二,如果水體和水樣的容積分別以V和v表示,水體和水樣中的大腸菌數(shù)分別以n和x表示。那么,V與v相比,n與x相比,都是很大的數(shù)字。就是說,v和x相對來說都是小到可以忽略的數(shù)字。就好像你去長江里取一瓶水,這瓶水對長江來說,可以忽略。
在容積為v的水樣中恰好出現(xiàn)x個大腸菌的概率符合泊松分布:
其中,x=0,1,2,3,......
在水樣容積v中恰好出現(xiàn)零個大腸菌的概率為:
如果每毫升水樣中的大腸菌個數(shù)為λ(注意:由此可知λ的單位是個/mL),則水樣v毫升中不出現(xiàn)大腸菌的概率為:
如果每毫升水樣中大腸菌個數(shù)為λ,則水樣中出現(xiàn)大腸菌的概率為:
那么在N支樣品容積為v的發(fā)酵管試驗中,恰好出現(xiàn)r支顯陰性反應,N-r支顯陽性反應的概率為:
在N1支樣品容積v1、N2支樣品容積v2、N3支樣品容積v3毫升的發(fā)酵管試驗中,如果呈陰性反應的支數(shù)恰好分別是r1、r2及r3,而呈陽性反應的支數(shù)恰好分別為N1-r1、N2-r2、N3-r3時,每毫升水樣中的大腸菌數(shù)仍用λ表示,那么,這一試驗結(jié)果發(fā)生的概率為:
好了,公式終于推出來了。我們的最大可能數(shù)就是上面這個公式中f(λ)最大值時對應的λ值,也就是我們想知道的濃度值。
先介紹一個最原始的計算過程。
這個公式中現(xiàn)在有四個未知量,N、r、v和λ。如果帶入具體試驗,你會發(fā)現(xiàn)其實只有一個λ是真正未知的。
例如,我們做9管法,稀釋度選10倍、100倍和1000倍,陽性管數(shù)是1-0-0(本來想算3-2-1,結(jié)果嘔血三升,實在算不下去,放棄了,又選了一個簡單的)那通過查MPN表結(jié)果是3.6MPN/g。那么N1、N2、N3都是3,r1、r2、r3代表陰性管,所以分別是2、3、3。那么v1、v2、v3就是稀釋度下樣品含量分別是0.1mL、0.01mL和0.001mL。未知的就只剩λ了,那么把上面這些參數(shù)代入公式,計算如下:
把這個公式轉(zhuǎn)化成函數(shù)圖是這樣的:
是不是和拋硬幣的那個圖完全不同了?這上面橫坐標就是1-0-0中對應的所有可能的菌濃度。我們要找的是最可能的值,也就是函數(shù)的最高點對應的λ值。
怎么算呢?用微積分求導數(shù)就行了,最高點的導數(shù)是等于0的。所以把上述公式求導:
這就是剛才公式的導函數(shù),只要讓這個導函數(shù)等于0,求相應的λ值就行了。具體計算對數(shù)學專業(yè)人士應該挺簡單的,但是對我們還是挺復雜的,所以我們再取個巧,直接做函數(shù)圖,圖上會幫我們計算。
看結(jié)果出來了,是3.571,四舍五入之后就是MPN表上的3.6了。我們看到的MPN表上的數(shù)值都是四舍五入之后的。
這么計算太麻煩了,所以在1942年,Thomas先生給出了一個估算MPN值的方法,計算過程比上面的方法簡單了很多很多。目前FDA介紹的也是這種估值的算法。注意,這個方法算出是估值,不是準確值。
公式是這樣的:
帶入公式:
估值是3.59,我們用第一個方法算出來的是3.571,結(jié)果還是很接近的,但是計算過程可是省事了很多,既不用求導數(shù)也不用解方程。而且兩個數(shù)四舍五入之后都是3.6。
好了,計算方法都介紹完了,如果每次我們做完試驗都需要這么計算一番才知道結(jié)果,是不是很痛苦?所以McCrady先生才做了MPN表,表格的每一項都是計算出來的,繪成表格后使用就方便了。只要查出管數(shù)的陽性數(shù)就可以查到相應的MPN值了。所以請珍惜和重視我們的MPN表吧,每個數(shù)據(jù)都是一點點算出來的,剎費苦心啊。
最后說一點,MPN/g與MPN/100g能不能換算?怎么換算呢?看完上面的介紹和計算應該明白了吧。可以換算,直接把MPN/g乘以100,就是MPN/100g。其實就是公式中λ的單位,現(xiàn)在假設(shè)的是個/mL,分子分母同時乘以100,就是個/100mL。
舉個例子。還是以大腸菌群的國標為例,我們從兩個標準附錄中的MPN表里隨機挑選幾個組合,列成下表。左邊是2003年的,右邊是2016年的。
上表可以看出兩個不同,一個是黃色標注的稀釋度不同,一個是綠色標注的結(jié)果單位不同。為了更直觀的看到這個100倍的差異,我們把稀釋度統(tǒng)一一下。根據(jù)國標MPN表中備注,選不同稀釋度時結(jié)果可相應放大或縮小一定倍數(shù),那么表格就變成了這樣。
稀釋度統(tǒng)一后,我們再來看結(jié)果,發(fā)現(xiàn)是不是就是100倍的差別?有兩個不同的,你想到了什么?是不是四舍五入?之前我就提過,MPN表有四舍五入修約的,不同時代的MPN表保留有效數(shù)字的位數(shù)不同,所以就修約成了不同的樣子,但是他們本質(zhì)上就是原始公式中λ的單位而已。
如果看到這里,在不翻書不求助的情況下,上面的計算你都能看懂。
恭喜您了,您一定是萬中無一的數(shù)學人才?。。。。?/strong>
畢竟大學畢業(yè)也好幾年了,就算剛畢業(yè),也距離大一大二好幾年了。很多東西都還給老師了,您如果還能記得,請一定重視自己的數(shù)學天賦,您的未來不可限量?。。。?!??