Sigma nedir? ~ Bilgi Ustanız
Connect with us

Matematik

Sigma nedir?

Yayınlandı!

on

Sigma nedir?

İstatistiksel analizde Sigma (σ) standart sapmayı ifade eder. Aşağıda tartışılacak olan incelikleri göz ardı ederek, standart sapmanın, bir miktar ölçümünün zorunlu olarak eşlik ettiği “± biraz” hatası olduğunu söyleyebiliriz . Bir nesnenin kütlesini ölçtüyseniz ve 100 ± 5 gramlık bir sonuç aldıysanız, “110 gram” değeri ölçülen sonuçtan iki standart sapma kadar (yani 2 sigma kadar), “50 gram” değeri 10 standart sapma kadar farklılık gösterir (10 sigma kadar)

Tüm bunlara neden ihtiyaç duyuluyor: sigma ve olasılıklar

Ne zaman hataları tartışırken, biz zaten ifade “söylediler ölçülen kütle 100 ± 5 gram gerçek kütlesi anlamına gelmez” garanti 95 105 gram aralığında yalan. Bu “± 1σ” aralığının dışında olduğu ortaya çıkabilir, ancak bir kural olarak, çok uzak değildir. Vakaların küçük bir yüzdesinde, “± 2σ” aralığının ötesine geçtiği ve çok nadiren “± 3σ” aralığının dışında olduğu ortaya çıkabilir. Genel olarak eğilim açıktır: Sigma, gerçek değerin ölçülen değerden çok farklı olma olasılığı ile ilgilidir.

Sigma nedir

Tüm matematiksel ayrıntıları atlayalım ve “normal dağılım” olarak adlandırılan en basit ve en yaygın durumun sonucunu gösterelim (şekle bakın). ± 1σ aralığına düşme olasılığı yaklaşık% 68, ± 2σ aralığı içinde – yaklaşık% 95, ± 3σ aralığı içinde – yaklaşık% 99,8, vb. Dolayısıyla, belirli bir anlaşma formüle edebiliriz:

Anlaşma: Sigma sayısındaki bir farklılığı ifade etmek, ölçümdeki bir tesadüften dolayı böyle veya daha büyük bir farkın olma olasılığı hakkında bir mesajdır.

Bu sözleşmeyi kullanmanın birçok yolu vardır. Eğer varsa sadece rapor ölçüm sonucunu (100 ± 5 gram) ve emin normal dağılım geçerli olduğunu, o zaman demek ki 90 aralığında% 95 yalan olasılığı getirir bu aralıkta% 68’i yalan bir olasılık ile gerçek kütle değeri 110 gram vb.

Ayrıca edebilirsiniz karşılaştırmak aynı miktar veya teorik hesaplamalar ile başkasının ölçümü ile ölçüm sonucunu. Sayıların farklı olduğunu görüyorsunuz ve iki sonuç arasında istatistiksel olarak önemli bir tutarsızlık olduğunu iddia edip edemeyeceğinizi görmek istiyorsunuz – yani, verilerdeki rastgele istatistiksel dalgalanmaya atfedilemeyecek bir anlaşmazlık. Sonra ifadeler şöyle geliyor:

  • Fark 1σ’dan küçükse , iki sayının birbiriyle aynı fikirde olma olasılığı% 32’den büyüktür. Bu durumda, basitçe iki sonucun hata payı içinde çakıştığını söylerler.
  • Fark 3σ’dan küçükse , iki sayının birbiriyle aynı fikirde olma olasılığı% 0,2’den büyüktür. Parçacık fiziğinde, bu olasılık herhangi bir ciddi sonuç için yeterli değildir ve geleneksel olarak şunu söylemek mümkündür: iki sonuç arasındaki fark istatistiksel olarak anlamlı değildir.
  • Fark 3σ ile 5σ arasındaysa , bu ciddi bir şeyden şüphelenmek için bir nedendir. Bununla birlikte, bu durumda bile, fizikçiler dikkatli konuşurlar: veriler iki sonuç arasında bir fark olduğunu gösterir.
  • Sadece iki sonucun 5σ veya daha fazla farklılık göstermesi durumunda fizikçiler iki sonucun birbirinden farklı olduğunu açıkça belirtirler.

 

Bu ifadeler özellikle yeni bir parçacık bulma söz konusu olduğunda standarttır. Deneysel verileri yeni bir parçacık olmadan yapılan teorik tahminle karşılaştırırsınız ve 3 ila 5 sigma arasında bir fark görürseniz, şunu söylersiniz: yeni bir parçacığın varlığının bir göstergesi alındı (İngilizce, kanıt). Fark 5 sigmadan fazlaysa, yeni bir parçacık keşfettik (keşif) diyorsunuz .

örnek 1

Bazı nadir mezon bozunmalarını incelediğinizi ve bunu Standart Modeldeki teorik tahminle karşılaştırdığınızı varsayalım . Kayıt kolaylığı için, ölçüm sonucunu aşağıdaki değer şeklinde ifade ettiniz:

μ  = (ölçülen bozulma olasılığı) / (teorik olarak tahmin edilen bozulma olasılığı)

ve cevabı aldım: μ  = 1.25 ± 0.25. Bu sonuç hakkında ne söyleyebilirsiniz?

Birincisi, sıfırdan beş sigma farklıdır. Bu, onun zaten bir keşif olarak sınıflandırıldığı anlamına gelir ve bu nedenle güvenli bir şekilde beyan edebilirsiniz: İstenen mezon çürümesini keşfettik (elbette bunu sizden önce başka biri yapmadıysa; o zaman mütevazı bir “keşif onayı” ile yetinmeniz gerekir). İkincisi, tek tek sigmadan farklıdır. Böyle bir sapma “ilginç değildir”, teorik hesaplamalardan istatistiksel olarak önemli bir fark bulduğunuzu söylemenize izin vermez. Böylece şunu eklersiniz: Ölçülen değer, Standart Modelin tahminleriyle uyumludur .

Ayrıca, 25 kat daha fazla istatistik topladığınızı, bu olasılığı ölçtüğünüzü ve güncellenmiş bir değer aldığınızı varsayalım: μ  = 1.20 ± 0.05. Sıfırdan fark zaten 24 sigma, dolayısıyla etkinin gerçekliği hakkında artık herhangi bir şüphe yok. Birinden farkı artık 4 sigma. Bu, Yeni Fiziği keşfettiğinizi iddia etmek için hala yeterli değil . Ancak verilerinizin 4 sigma düzeyinde teorik tahminlerle farklı olduğunu ve Standart Model dışında bir etkiye işaret ettiğini açıkça söyleyebilirsiniz .

Örnek 2

Bazı süreçlerde müonların ve anti-müonların üretimini inceliyorsunuz ve farklı olasılıklarla doğdukları sonucuna varılıp varılamayacağını bilmek istiyorsunuz. Müonlar için ( μ  ), doğum olasılığınız   = 0.18 ± 0.03 ve anti-müonlar için ( μ + ) –  +  = 0.30 ± 0.04. Fark 0.12, ancak bu fark ne kadar önemli?

Normal dağılımlar her iki hata için de doğruysa ve ayrıca bu hatalar tamamen bağımsızsa (aralarında korelasyon yoksa), o zaman +  –   değerinin toplam hatası , kareler formülünün toplamı ile hesaplanır . Bu nedenle, ölçüm sonucu +  –    = 0.12 ± 0.05. Aradaki fark 2.4 sigma ve bu ciddi sonuçlar için hala yeterli değil.

“Güven” ve “istatistiksel anlamlılık”

Yukarıdaki örneklerde, “evet” veya “hayır” ile yanıtlanabilecek sorularla ilgilendiğimizi unutmayın. Alınan verilerde yeni parçacık var mı? Momentum dağılımı teorik hesaplamalarla tutarlı mı? İşlemin kesiti çarpışma enerjisine bağlı mı? Bir parçacık, karşıt parçacığıyla aynı kütleye mi sahip? Bu soruları verilerle cevaplamaya çalışmak, bilimsel tabirle hipotez testi olarak adlandırılır . Ayrıntılı bir cevap gerektiren sorular (bir şeyi hesaplamak, bir şeyi açıklamak vb.) Hipotez olarak adlandırılmaz.

En basit yaklaşımda, hipotezin deneysel bir testinin sonucu şu şekildedir: yanıt p olasılıkla “evet” ve yanıt 1 – p olasılıkla “hayır” dır . Bu olasılıklar sonucu iletmek için çok önemlidir; fizikçiler genellikle olasılıkları belirtmeden mutlak ifadeler (“keşfettik” veya “çürütdük”) yapmaktan kaçınırlar.

Ancak burada hemen önemli bir açıklama yapılmalıdır. Açıkça anlaşılırsa, popüler bilim haberleri için ” Bilim adamları yeni bir şey keşfettiklerinden% 99 eminler ” gibi standart ifadelerin neden aldatıcı olduğu anlaşılacaktır .

Bilim adamlarının genellikle kullandığı tam ifade şudur:

Hipotez test edilirken, istatistiksel anlamlılık düzeyinde cevap “evet” idi  p.

Bununla birlikte,  p genellikle sigma cinsinden ifade edilir. İngiliz dili literatüründe güven düzeyi, CL (güven düzeyi) ifadesi kullanılmaktadır. Rusçada hala bazen “istatistiksel güvenilirlik” diyorlar, ancak böyle bir ifade anlamada kafa karışıklığına yol açabilir.

“Popüler” bir ifade ile gerçek bir ifade arasındaki fark şudur. Herhangi bir ölçüm sadece istatistiksel değil, aynı zamanda sistematik hatalara da sahiptir. Yukarıda açıklanan olasılıklar ve sigma sayıları arasındaki ilişki kuralları, yalnızca istatistiksel hatalar için çalışır – ve o zaman normal dağılım bunlara uygulanabilirse. İstatistiksel hatalar her zaman doğru bir şekilde hesaplanabiliyorsa, sistematik hatalar biraz sanattır. Üstelik uzun yıllara dayanan deneyimlerinden bu kadar güçlü olduğu bilinmektedir.sistematik sapmalar kesinlikle normal dağılımla tanımlanmaz ve bu nedenle bu yeniden hesaplama kuralları onlar için geçerli değildir. Dolayısıyla, deneyciler her şeyi defalarca tekrar kontrol etseler ve sistematik bir hata belirtmiş olsalar bile, her zaman bir şeyi gözden kaçırma riski vardır. Bu riski doğru bir şekilde değerlendirmek imkansızdır , bu nedenle cevabınızın hangi gerçek olasılıkla doğru olduğunu gerçekten bilmiyorsunuz.

Elbette, özellikle deneyimli deneysel gruplardan geliyorsa, varsayılan olarak önyargıya güvenilmelidir. Ancak, temel parçacıkların araştırılmasındaki yüzyılların deneyimi, tüm önlemlere rağmen, düzenli olarak delinme meydana geldiğini göstermektedir. Bir işbirliği bazı hipotezlerle güçlü bir şekilde çelişen bir sonuç alır, analizi birçok kez yeniden kontrol eder ve herhangi bir hata bulmaz. Ancak, bu sonuç başkaları tarafından onaylanmaz – bazen çok daha doğru! – deneyler. Neden ilk deney o kadar tuhaf bir sonuç verdi ki, bir hatanın olduğu veya hesaba katılmayan bir hata olduğu yerde değildi – tüm bunlar genellikle belirsiz kalır (ancak bazen, OPERA deneyindeki “süper lüminal” nötrinolarda olduğu gibi, hatanın kaynağı hızla ortaya çıkar)

Fizikçiler zaten bu tür olaylara alışmışlardır, bu nedenle, o zamana kadar geçerli olan tüm tablodan çok farklı olan her deneysel sonuç, haklı bir şüpheye neden olur. Fizikçiler, tavırlarında o kadar muhafazakârlar ki, geriye dönük oldukları için ve fiziğin inkârcılarının sunmak istediği gibi herhangi bir teoriye sıkıca inandıkları için değil. Parçacık fiziğindeki önceki tüm deneyimlerden yeni öğrendiler ve genellikle nasıl bittiğini biliyorlar. Bu nedenle, diğer deneyler tarafından bağımsız olarak onaylanmadan bu tür hisleri desteklemezler.

Diğer bilimlerle karşılaştırıldığında FEP

Yukarıda formüle edilen katı istatistiksel güvenilirlik kriterlerinin, tam olarak temel parçacıkların fiziği ve bazı ilgili bölümler için karakteristik olduğu söylenmelidir. Fiziğin diğer birçok dalında ve hatta diğer disiplinlerde (özellikle biyomedikal bilimlerde) kriterler çok daha zayıftır.

Bazı verileri ölçtüğünüzü ve bunların “normlara uyma” olasılığının ne kadar olduğunu bilmek istediğinizi varsayalım. Sadece istatistiksel dalgalanmalardan kaynaklanan gerçek bir sapma olmaksızın “normal bir durumun” bunu veya daha da fazla sapma vermesi olasılığını veren bir istatistiksel test yürütüyorsunuz. Bu olasılığa p değeri denir . Biyolojide, altına inildiğinde gerçek bir farktan emin bir şekilde söz edilebilecek eşik p- değeri yüzde bir veya hatta birkaçdır. Temel parçacıkların fiziğinde, böyle bir fark genellikle önemli görülmez, herhangi bir farklılığın “varlığının göstergesi” bile yoktur! EF’deki ayrım seslerinin sorumlu beyanı yalnızca p-iki milyonda birden küçük değerler (yani, sapma 5σ’dan büyüktür). İfadelerin güvenilirliğine yönelik böylesine sert bir yaklaşım, deneycilerin 3σ bölgesinde önemli bir çok sapma gördükleri ve daha sonra bu “keşifler” doğrulanmamış olsa da cesurca yeni parçacıkların keşfini ilan ettikleri bir dönemde, yaklaşık yarım yüzyıl önce HEP’te geliştirildi. Bu kriterin kökeni hakkında ayrıntılı bir açıklama için Tommaso Dorigo’nun gönderilerine ( bölüm 1 , bölüm 2 ) bakın.

Continue Reading
Yorum Yap

Yorum Yap

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Advertisement

Popüler