Vedci Používajú Menej Ako 1% údajov Zozbieraných Large Hadron Collider - Alternatívny Pohľad

Vedci Používajú Menej Ako 1% údajov Zozbieraných Large Hadron Collider - Alternatívny Pohľad
Vedci Používajú Menej Ako 1% údajov Zozbieraných Large Hadron Collider - Alternatívny Pohľad

Video: Vedci Používajú Menej Ako 1% údajov Zozbieraných Large Hadron Collider - Alternatívny Pohľad

Video: Vedci Používajú Menej Ako 1% údajov Zozbieraných Large Hadron Collider - Alternatívny Pohľad
Video: Брайан Кокс про суперколлайдер ЦЕРНа 2024, Apríl
Anonim

Je zrejmé, kedy je problém získať vedecké údaje. Ukazuje sa však, že je problém ich uložiť a spracovať.

Celá séria vysoko profilovaných objavov uskutočnených s nárazníkom bola založená na analýze údajov, ktorých objem je menší ako jedno percento z celkového objemu generovaných údajov.

Zvyšok údajov sa nenávratne stratí.

Kolízny tunel s 26,7 km sa používa na urýchlenie častíc blízkych rýchlosti svetla. Dva prúdy častíc pohybujúcich sa v opačných smeroch sa zrážajú v miestach v priestore monitorovaných citlivými senzormi. Aj pri najnižšej hustote protónových lúčov obsahujúcich každý 120 miliónov protónov je počet zrážok 30 miliónov zrážok za sekundu.

Podľa informácií uverejnených na webovej stránke Európskej organizácie pre jadrový výskum CERN vytvára jedna miliarda zrážok za sekundu dátový tok 1 petabajt za sekundu. A to je v súčasnosti najväčší problém, pretože tok údajov s takou rýchlosťou sa jednoducho nedá uložiť, nieto to správne spracovať. „Pri minimálnom počte 30 miliónov zrážok potrebujeme 2 000 petabajtov, aby sme mohli uložiť výsledky typickej 12-hodinovej zrážkovej fázy. Pri 150 spusteniach kolízorov ročne by uloženie všetkých údajov vyžadovalo 400 000 petabajtov, 400 exabajtov údajov, čo je obrovský objem, ktorý v súčasnosti nemôžeme ani uložiť, “hovorí Andreas Hoecker, vedkyňa CERN.

Riešením problému veľkého množstva údajov je, samozrejme, drastické zníženie ich objemu. A to sa nerobí na úkor akýchkoľvek algoritmov kompresie informácií, preto nie je dostatok energie všetkých procesorov existujúcich superpočítačov. Možnosti počítačovej technológie dostupnej v CERN umožňujú ukladať výsledky iba 1200 kolízií na každých 30 miliónov takýchto prípadov. To je 0,004% z celkového objemu a zvyšných 99,996%, ako je uvedené vyššie, sa navždy stratí.

Image
Image

Tento stav sa javí ako hrozný odpad, ale nie všetko je také smutné. Fenomény, ktoré skutočne zaujímajú vedcov, nevznikajú týmto tempom. Napríklad, Higgsov bozón sa objavuje rýchlosťou raz za sekundu, zatiaľ čo iné udalosti sa vyskytujú pri frekvencii desiatok alebo stokrát za sekundu. Na zvýraznenie najzaujímavejších údajov z celého toku údajov sú zahrnuté špeciálne spúšťače, ktoré vykonávajú predbežné filtrovanie údajov hlavne na hardvérovej úrovni. Tieto spúšťače sú vyvinuté pre každý konkrétny prípad a sú vyladené v súlade s vlastnosťami hľadaných častíc, ako je napríklad Higgsov bozón, pravý kvark, bozóny W a Z atď.

Propagačné video:

Pri takejto implementácii predbežného spracovania údajov sa samozrejme stratia niektoré zaujímavé údaje spolu s horou zbytočných a nezaujímavých „odpadkov“. Zostávajúce informácie však obsahujú hlavne významné údaje a ich pomerne skromný objem už umožňuje dostatočne hlboké spracovanie aj v reálnom čase.

Na záver treba poznamenať, že riešením vyššie uvedeného problému nie je v žiadnom prípade zabezpečenie možnosti ukladania väčšinou zbytočných údajov. Riešením problému je vytvorenie nových senzorov pre kolider, ktorý bude využívať najnovšie úspechy moderných technológií a ktorý bude schopný preniknúť do hĺbky momentálne nepreskúmaných oblastí fyziky. Mimochodom, niektoré z týchto senzorov sa objavia pri zrážke počas najbližšej modernizácie. A spustenie modernizovaného nárazníka je naplánované na rok 2025.

Odporúčaná: