ට්රාන්ස්ෆෝමර්

මෙයකඩදාසි ස්විච් ට්රාන්ස්ෆෝමර් කුඩා ක්රියාත්මක කිරීමකි: සරල හා කාර්යක්ෂම ස්පාර්ශිකමකින් යුත් ට්රිලියන පරාමිති ආකෘති දක්වා පරිමාණයකිරීම. අපගේ ක්රියාත්මක කිරීම සඳහා ඇත්තේ පරාමිතීන් මිලියන කිහිපයක් පමණක් වන අතර සමාන්තරව බෙදා හරින ලද පුහුණුව ආදර්ශයට නොගනී. එය තනි GPU පුහුණු කරන්නේ නමුත් අපි කඩදාසි විස්තර කර ඇති පරිදි මාරු සංකල්පය ක්රියාත්මක.

වේගවත් බර ට්රාන්ස්ෆෝමර්

මෙයකඩදාසි ක්රියාත්මක කිරීමකි රේඛීය ට්රාන්ස්ෆෝමර් පයිටෝර්ච් හි රහසින් වේගවත් බර මතක පද්ධතිවේ.

FNet: ෆූරියර් පරිණාමනය සමඟ ටෝකන මිශ්ර කිරීම

මෙයකඩදාසි ක්රියාත්මක කිරීමයි FNet: ෆූරියර් ට්රාන්ස්පෝර්ම් සමඟ ටෝකන මිශ්රකිරීම.

අවධානය නිදහස් ට්රාන්ස්ෆෝමර්

මෙයකඩදාසි ක්රියාත්මක කිරීමකි අවධානය රහිත ට්රාන්ස්ෆෝමරයක්.

වෙස් භාෂා ආකෘතිය

මෙයකඩදාසි වල පෙර පුහුණුව සඳහා භාවිතා කරන ලද මාස්ඩ් භාෂා ආකෘතිය ක්රියාත්මක කිරීම BERT: භාෂා අවබෝධය සඳහා ගැඹුරු ද්විපාර්ශ්වික පරිවර්තක පූර්ව පුහුණුව.

එම්එල්පී-මික්සර්: දැක්ම සඳහා සර්ව එම්එල්පී ගෘහ නිර්මාණ ශිල්පයක්

මෙයකඩදාසි එම්එල්පී-මික්සර් ක්රියාත්මක කිරීමකි: දැක්ම සඳහා සර්ව එම්එල්පී ගෘහ නිර්මාණ ශිල්පය.

MLPs (GMLP) වෙත අවධානය යොමු කරන්න

මෙයකඩදාසි ක්රියාත්මක කිරීමකි MLPs වෙත අවධානය යොමු කරන්න.

දර්ශන ට්රාන්ස්ෆෝමර් (VIT)

මෙමකඩදාසි ක්රියාත්මක කිරීම රූපයක් වර්ත් 16x16 වචන: පරිමාණ දී රූප පිළිගැනීම සඳහා ට්රාන්ස්ෆෝමර්.

ප්රයිමර් EZ

මෙයකඩදාසි ක්රියාත්මක කිරීමකි ප්රයිමර්: භාෂා ආකෘති නිර්මාණය සඳහා කාර්යක්ෂම ට්රාන්ස්ෆෝමර් සෙවීම.

Hourglass

මෙයකඩදාසි ක්රියාත්මක කිරීමකි ධූරාවලි ට්රාන්ස්ෆෝමර් වඩාත් කාර්යක්ෂම භාෂා ආකෘති

112from .configs import TransformerConfigs
113from .models import TransformerLayer, Encoder, Decoder, Generator, EncoderDecoder
114from .mha import MultiHeadAttention
115from labml_nn.transformers.xl.relative_mha import RelativeMultiHeadAttention