Ekwuru na ụlọ ọrụ teknụzụ na-achọ GPU ma ọ bụ n'ụzọ iji nweta ha. N'April, Tesla CEO Elon Musk zụtara 10,000 GPU ma kwuo na ụlọ ọrụ ahụ ga-anọgide na-azụta nnukwu GPU site na NVIDIA. N'akụkụ ụlọ ọrụ, ndị ọrụ IT na-agbasi mbọ ike iji hụ na a na-eji GPUs eme ihe mgbe niile iji bulie nloghachi na ntinye ego. Agbanyeghị, ụfọdụ ụlọ ọrụ nwere ike ịchọpụta na ka ọnụọgụ GPU na-abawanye, enweghị ọrụ GPU na-akawanye njọ.
Ọ bụrụ na akụkọ ihe mere eme akụzierela anyị ihe ọ bụla gbasara mgbakọ na mwepụ dị elu (HPC), ọ bụ na nchekwa na ịkparịta ụka n'Ịntanet ekwesịghị ịchụ àjà n'ihi itinye uche dị ukwuu na mgbakọ. Ọ bụrụ na nchekwa enweghị ike ịnyefe data nke ọma gaa na kọmpụta kọmpụta, ọbụlagodi na ị nwere ọtụtụ GPU n'ụwa, ị gaghị enweta ezigbo ọrụ.
Dabere na Mike Matchett, onye nyocha na Small World Big Data, enwere ike igbu obere ụdị na ebe nchekwa (RAM), na-enye ohere itinyekwu uche na mgbako. Agbanyeghị, ụdị ndị buru ibu dị ka ChatGPT nwere ọtụtụ ijeri ọnụ enweghị ike ịchekwa na ebe nchekwa n'ihi ọnụ ahịa dị elu.
"Ị nweghị ike itinye ọtụtụ ijeri ọnụ ọnụ na ebe nchekwa, ya mere nchekwa na-adịkwa mkpa karịa," Matchett na-ekwu. O di nwute, a na-eleghara nchekwa data anya n'oge usoro nhazi.
N'ozuzu, n'agbanyeghị ihe eji eme ihe, e nwere isi ihe anọ na-emekarị na usoro ọzụzụ nlereanya:
1. Ọzụzụ Nlereanya
2. Ngwa ntinye aka
3. Nchekwa data
4. Ịgbakọ ngwa ngwa
Mgbe ị na-eke ma na-ebuga ụdị, ọtụtụ ihe a chọrọ na-ebute ụzọ ihe akaebe ngwa ngwa (POC) ma ọ bụ gburugburu nnwale iji malite ọzụzụ ụdị, yana nchekwa data adịghị mkpa nlebara anya nke ọma.
Otú ọ dị, ihe ịma aka ahụ dabeere n'eziokwu na ọzụzụ ma ọ bụ ntinye ntinye nwere ike ịdịru ọnwa ma ọ bụ ọbụna ọtụtụ afọ. Ọtụtụ ụlọ ọrụ na-ebuli nha ihe nlereanya ha ngwa ngwa n'oge a, akụrụngwa ga-agbasawanye iji nabata ụdị na-eto eto na datasets.
Nnyocha sitere na Google na ọtụtụ nde ọrụ ọzụzụ ML na-ekpughe na nkezi nke 30% nke oge ọzụzụ na-etinye na pipeline data ntinye. Ọ bụ ezie na nyocha gara aga lekwasịrị anya n'ịkwalite GPU iji mee ka ọzụzụ dị ngwa, ọtụtụ ihe ịma aka ka na-anọgide na-ebuli akụkụ dị iche iche nke pipeline data. Mgbe ị nwere ike mgbakọ dị ịrịba ama, ezigbo mkpọ na-aghọ ngwa ngwa ị nwere ike ịnye data n'ime mgbakọ iji nweta nsonaazụ.
Kpọmkwem, ihe ịma aka ndị dị na nchekwa data na njikwa na-achọ atụmatụ maka uto data, na-enye gị ohere ịwepụta uru data ka ị na-aga n'ihu, ọkachasị mgbe ị na-etinye aka n'okwu ikpe dị elu dị ka mmụta miri emi na netwọkụ akwara ozi, nke na-etinye ihe dị elu. nchekwa na usoro nke ikike, arụmọrụ, na scalability.
Ọ kachasị:
scalability
Ịmụ igwe chọrọ ijikwa oke data, yana ka oke data na-abawanye, izi ezi nke ụdị na-akakwa mma. Nke a pụtara na azụmaahịa ga-anakọta ma chekwaa data karịa kwa ụbọchị. Mgbe nchekwa enweghị ike ịba ụba, oke ọrụ data na-arụ ọrụ na-emepụta ihe mgbochi, na-amachi arụmọrụ ma na-ebute oge GPU dị oke ọnụ.
Mgbanwe
Nkwado mgbanwe maka ọtụtụ protocols (gụnyere NFS, SMB, HTTP, FTP, HDFS, na S3) dị mkpa iji gboo mkpa nke usoro dị iche iche, kama ịbụ nanị otu ụdị gburugburu ebe obibi.
Latency
Latency I/O dị oke mkpa maka iwulite na iji ụdị dịka a na-agụ ma na-agụgharị data ọtụtụ oge. Mbelata nkwụsị I/O nwere ike belata oge ọzụzụ nke ụdị site na ụbọchị ma ọ bụ ọnwa. Mmepe ụdị ọsọ ọsọ na-atụgharị ozugbo gaa na uru azụmaahịa ka ukwuu.
Ntinye aka
Ntinye nke sistemu nchekwa dị oke mkpa maka ọzụzụ ụdịdị nke ọma. Usoro ọzụzụ na-agụnye nnukwu data, na-emekarị na terabytes kwa elekere.
Nweta Ndekota
Iji nweta nsonaazụ dị elu, ụdị ọzụzụ na-ekewa mmemme n'ime ọtụtụ ọrụ yiri ya. Nke a na-apụtakarị na algọridim mmụta igwe na-enweta otu faịlụ site na ọtụtụ usoro (nwere ike na ọtụtụ sava anụ ahụ) n'otu oge. Sistemu nchekwa ahụ ga-enwerịrị ihe achọrọ n'otu oge na-emebighị arụmọrụ.
Site n'ikike ya pụtara ìhè na nkwụsị dị ala, ntinye dị elu, yana nnukwu myirịta I/O, Dell PowerScale bụ ezigbo nchekwa nkwado na kọmpụta agbagoro GPU. PowerScale na-ebelata nke ọma oge achọrọ maka ụdị nyocha nke na-azụ ma nwalee ọtụtụ terabyte datasets. Na PowerScale niile-flash nchekwa, bandwit na-abawanye site na 18 ugboro, na-ewepụ I / O bottlenecks, na ike tinye ya na isilon ụyọkọ dị ugbu a iji mee ngwa ngwa na imeghe uru nke nnukwu ego nke data na-adịghị edozi.
Ọzọkwa, PowerScale's multi-protocol access ike na-enye mgbanwe na-enweghị njedebe maka ịrụ ọrụ ọrụ, na-enye ohere ka echekwara data site na iji otu protocol wee nweta site na iji ọzọ. Kpọmkwem, njirimara dị ike, mgbanwe, scalability, na arụmọrụ ọkwa ụlọ ọrụ nke ikpo okwu PowerScale na-enyere aka dozie nsogbu ndị a:
- Mee ngwa ngwa ọhụrụ ihe ruru ugboro 2.7, na-ebelata usoro ọzụzụ ihe nlereanya.
- Wepụ mkpirisi I/O ma nye ọzụzụ na nkwado ihe nlereanya ngwa ngwa, izi ezi ihe nlere anya, nrụpụta sayensị data emelitere, yana nkwụghachi azụ na ntinye ego ịgbakọ site n'ịkwalite atụmatụ ọkwa ụlọ ọrụ, arụmọrụ dị elu, concurrency, na scalability. Welite izi ezi ihe nlereanya site na iji dataset dị omimi, nke dị elu site n'itinye ihe ruru 119 PB nke ikike nchekwa dị irè n'otu ụyọkọ.
- Mezue mbugharị n'ogo site na ịmalite obere na ịgbakọ mkpokọta na nchekwa onwe ya, na-ebuga nchekwa data siri ike yana nhọrọ nchekwa.
- Melite mmepụta sayensị data site na nyocha n'ime ebe yana ngwọta akwadoro maka mbugharị ngwa ngwa, obere ihe ize ndụ.
- Ịkwalite atụmatụ egosipụtara dabere na teknụzụ kachasị mma, gụnyere NVIDIA GPU osooso na nrụtụ aka na sistemụ NVIDIA DGX. Ọrụ dị elu nke PowerScale na concurrency na-ezute ihe nchekwa nchekwa chọrọ n'ọkwa ọ bụla nke mmụta igwe, site na nnweta data na nkwadebe ruo n'ụdị ọzụzụ na ntinye aka. Yana sistemụ arụmọrụ OneFS, ọnụ ọnụ niile nwere ike ịrụ ọrụ n'enweghị nsogbu n'ime otu ụyọkọ OneFS na-achụ, yana njirimara ọkwa ụlọ ọrụ dị ka njikwa arụmọrụ, njikwa data, nchekwa na nchekwa data, na-enye ohere ịmecha ọzụzụ ụdị na nkwado maka azụmaahịa.
Oge nzipu: Jul-03-2023