Null TestsNull Тестүүд
Control & Shuffled Zero TestsХяналт & Холилдсон Тэгийн Тестүүд
To assess whether the observed signal could be a statistical artifact, we ran control tests using shuffled zeros and random data.
Дохио жинхэнэ бөгөөд статистикийн артефакт биш гэдгийг баталгаажуулахын тулд холилдсон тэгүүд болон санамсаргүй өгөгдөл дээр хяналтын тест хийсэн.
REAL ZEROS
0.014
Pearson r on zeros3 blockzeros3 блок дээрх Pearson r
✅ prime-indexed excess patterns observed across tested ranges
SHUFFLED ZEROS
~0.0
Pearson r on shuffled data (mean)Холилдсон өгөгдөл дээрх Pearson r (дундаж)
❌ No systematic signal
Test methodologyТестийн арга зүй
✓
Shuffle test:Shuffle тест:
Random permutations of γₙ values → compute A(p) → Pearson r ≈ 0 across all shuffles. Confirms signal is in the ordering of zeros, not their marginal distribution.
γₙ утгуудын санамсаргүй зөвшилд A(p) тооцоолно → Pearson r ≈ 0. Дохио нь тэгүүдийн дараалалд байгааг, тэдгээрийн маргинал тархалтад биш гэдгийг батална.
✓
GUE surrogate test:GUE суррогат тест:
Random GUE eigenvalue spacings → no BK-type prime excess detected. The effect is specific to actual Riemann zeros.
Санамсаргүй GUE эгэн утгын зайнуудад BK-төрлийн прайм илүүдэл илрэхгүй. Эффект нь яг Риман тэгүүдэд хамаарна.
✓
Non-prime lag control:Прайм биш лаг хяналт:
Tested covariance at non-prime lags (composite numbers). Mean excess ≈ 0, confirming the signal is prime-specific.
Прайм биш лаг (нийлмэл тоо) дээр ковариансыг тест хийсэн. Дундаж илүүдэл ≈ 0, дохио прайм-өвөрмөц гэдгийг баталж байна.
✓
Cross-dataset consistency:Датасетүүд хоорондын тогтвортой байдал:
Effect appears across zeros2, zeros3, zeros4 at very different heights (T ≈ 74,920 to T ~ 10¹³). Rules out height-specific artifacts.
Эффект нь zeros2, zeros3, zeros4 дээр маш өөр өндрүүдэд (T ≈ 74,920-аас T ~ 10¹³) гарч байна. Өндөр-өвөрмөц артефактыг үгүйсгэнэ.
FINAL RESULT — Chebyshev ψ₀(x) Validation
Following the explicit formula framework: A(p) vs ψ₀(p) correlation = r = 0.017, p-val = 0.95 — consistent with null results. The r=0.5113/0.6847/0.4509 values above are intermediate and superseded by this result.
Null tests reduce the likelihood of false positives but do not prove the BK law. Independent replication is still needed.
Null тестүүд худал эерэг гарах магадлалыг бууруулдаг боловч BK хуулийг нотолдоггүй. Бие даасан баталгаажуулалт хэвээр шаардлагатай.
Bootstrap Stability Tests
Bootstrap Тогтвортой Байдлын Тестүүд
1,000 bootstrap iterations per dataset — random 50% subsampling, Pearson r computed each time. Tests whether the observed correlation is stable or a finite-sample artifact.
Датасет бүрт 1,000 bootstrap давталт — санамсаргүй 50% дэд дээж, Pearson r тооцоолсон. Ажиглагдсан корреляц тогтвортой эсэх, эсвэл finite-sample артефакт эсэхийг шалгана.
zeros1 · N=100,000
0.355
mean r · std=0.259
95% CI: [−0.27, +0.75]
UNSTABLE — high variance
ТОГТВОРГҮЙ — өндөр вариансь
zeros6 · N=2,001,052
0.680
mean r · std=0.089
95% CI: [+0.49, +0.84]
MODERATE — interpret cautiously
ДУНД — болгоомжтой тайлбарла
zeros_ht · N=10,000
0.090
mean r · std=0.298
95% CI: [−0.49, +0.65]
UNSTABLE — possible overfitting
ТОГТВОРГҮЙ — overfitting боломжтой
| Dataset |
N zeros |
Full-sample r |
Bootstrap mean r |
95% CI |
Verdict |
| zeros1 |
100,000 |
0.6847 |
0.355 |
[−0.27, +0.75] |
UNSTABLE |
| zeros6 |
2,001,052 |
0.6795* |
0.680 |
[+0.49, +0.84] |
MODERATE |
| zeros_ht |
10,000 |
0.5113 |
0.090 |
[−0.49, +0.65] |
UNSTABLE |
Interpretation
Тайлбар
The high full-sample r values (0.6847, 0.5113) do not survive bootstrap resampling in most datasets. Bootstrap mean r drops to 0.09–0.36 with wide confidence intervals spanning zero. This strongly suggests the observed correlations are sensitive to the specific subset of zeros used — consistent with finite-sample overfitting rather than a robust signal. The zeros6 result (mean r = 0.68) is more stable but still requires independent replication. These results should be read as a significant caution against over-interpreting the full-sample correlations.
Өндөр full-sample r утгууд (0.6847, 0.5113) нь ихэнх датасет дахь bootstrap дахин дээжлэлтэд тэсдэггүй. Bootstrap дундаж r нь тэгийг хамарсан өргөн итгэлийн интервалтайгаар 0.09–0.36 болж буурна. Энэ нь ажиглагдсан корреляцууд нь ашигласан тэгүүдийн тодорхой дэд дээжид мэдрэмтгий болохыг — хүчтэй дохио биш finite-sample overfitting-тэй нийцэж байгааг хүчтэй харуулж байна. zeros6 үр дүн (дундаж r = 0.68) илүү тогтвортой боловч бие даасан баталгаажуулалт шаардлагатай хэвээр байна.