Isang kalahating araw ng pagsasanay gamit ang ilang daang dolyar ay nagdudulot ng katulad na mga resulta sa mga pangunahing malalaking modelo, open-source at libreng commercial na domain-specific na LLM solusyon

63 One half-day of training using a few hundred dollars yields similar results to mainstream large models, open-source and commercial-free domain-specific LLM solution

SINGAPORE, Oct. 1, 2023 — Kamakailan lamang, nabuo ng Colossal-AI ang isang kamangha-manghang domain-specific na malaking modelo ng wika (LLM) sa pamamagitan lamang ng ilang daang dolyar na gastos sa pagsasanay. Maaari itong madaling ilapat sa iba’t ibang mga domain, na nagpapadali sa ekonomikal na pagbuo ng malalaking modelo ng AI.

Ang solusyon ay madaling ma-access nang walang anumang mga komersyal na paghihigpit, na may ganap na transparency na ibinigay sa buong proseso ng pagsasanay, code, at mga timbang ng modelo.

Ang mga teknikal na detalye, open-source code at mga timbang ay available sa: https://github.com/hpcaitech/ColossalAI

Bridging from any general large models to any domain-specific large models with only a few hundred dollars.

Pagganap

Hindi lamang pinalalakas ng modelo ng Colossal-AI ang mga kakayahan sa wikang Intsik kundi pinapainam din nito ang kahusayan nito sa Ingles. Napakatanyag, ipinapakita nito ang mga antas ng pagganap na katumbas ng state-of-the-art (SOTA) na mga modelo ng katulad na laki sa loob ng open-source na komunidad.

Kasabay nito, nag-aalok ang Colossal-AI ng komprehensibong balangkas ng pagsusuri, ang ColossalEval, na nagpapadali sa cost-effective na pagkakapareho.

Bilang karagdagan, may mga limitasyon ang fine-tuning sa pamamagitan ng mga pamamaraan tulad ng SFT at LoRA sa epektibong pagsasama ng kaalaman at mga kakayahan mula sa base model. Hindi ito nakakasapat na natutugunan ang mga kinakailangan para sa pagbuo ng mataas na kalidad na domain-specific na kaalaman o espesyalisadong mga application ng modelo.

Pagtulay mula sa Pangkalahatang Malalaking Mga Modelo patungo sa Mga Domain-specific na Malalaking Modelo

Higit sa lahat, ang paglikha ng isang bersyon sa wikang Intsik ay hindi lamang nag-aalok ng pakinabang ng muling paggamit kundi may malaking kahalagahan din ito sa mga tunay na scenario ng pagpapatupad.

Malawakang kinikilala na napakalaki ng gastos sa pre-training ng malalaking modelo ng AI mula sa simula, madalas na nakakatawang tinutukoy bilang isang domain na maa-access lamang ng mga may “50 milyong dolyar” na sobra.

Maraming mga higanteng tech at mga AI startup ang gustong mamuhunan nang malaki sa pagbuo ng malalaking pangkalahatang layuning mga modelo. Gayunpaman, sa likod ng pangkalahatan ng mga malalaking modelo ito ay madalas na nakatago ang kakulangan sa domain-specific na kaalaman. Bilang resulta, ang isyu ng praktikal na pagiging naaangkop ay partikular na seryoso.

Kung ang isang domain-specific na malaking modelo ay mabilis at cost-effective na maitayo, sinundan ng fine-tuning para sa partikular na mga pangangailangan sa negosyo, ito ay walang-alinlangang magpapataas sa pagdeploy ng mga application, na nagbibigay ng kompetitibong pakinabang.

Ang paggamit ng nabanggit na proseso upang gawin ang paglipat ng kaalaman sa anumang larangan ay nagpapahintulot sa cost-effective na pagtatayo ng mga lightweight na domain-specific na pundasyonal na malalaking modelo.

Para sa pagtatayo ng mga pundasyonal na malalaking modelo mula sa simula, maaari ring kumuha ng inspirasyon mula sa mga nabanggit na karanasan at mga kakayahan ng Colossal-AI sa pagbawas ng gastos at pagpapataas ng kahusayan upang mabilis at minimal na gastos na maabot ang layuning ito.

Pag-optimize ng Colossal-AI System at Cloud Platform

Ang kamangha-manghang pagganap at mga pakinabang sa gastos ay nakatayo sa pundasyon ng mababang gastos na sistema ng pag-develop ng malaking modelo ng AI, ang Colossal-AI.

Pinapakinabangan ng Colossal-AI ang mga epektibong teknik upang mabawasan ang mga gastos sa pagsasanay, fine-tuning, at pagsasagawa ng malalaking modelo ng AI. Nakipagtulungan ito sa maraming Fortune 500 na mga kompanya at iba pang kilalang mga enterprise.

Upang lalo pang mapahusay ang kahusayan ng pag-develop at pagdeploy ng malalaking modelo, na-upgrade ang Colossal-AI sa Colossal-AI cloud platform, na ngayon ay nasa public beta, at ang pagrehistro ay magbibigay sa iyo ng mga voucher.

Colossal-AI Cloud Platform: platform.colossalai.com

Colossal-AI Open Source Address: https://github.com/hpcaitech/ColossalAI

Tungkol sa HPC-AI Tech

Ang HPC-AI Tech ay isang startup na nakabase sa Singapore. Ang kanilang flagship product, ang Colossal-AI, ay isang versatile na system ng malalim na pagkatuto na dinisenyo para sa panahon ng malalaking modelo ng AI. Pinapagana nito ang epektibo at mabilis na pagdeploy ng pagsasanay at pagsasagawa ng malalaking modelo ng AI, na nagreresulta sa makabuluhang pagbawas ng gastos para sa mga application ng malalaking modelo ng AI. Nangalap ang HPC-AI Tech ng 22 milyong USD sa Series A Funding noong Hulyo 2023.

Para sa mga pagtatanong ng media o karagdagang impormasyon, mangyaring makipag-ugnay sa:

contact@hpc-ai.tech

Photo – https://phnotes.com/wp-content/uploads/2023/10/73a7a775-f2.jpg