
মার্কিন-চীন এআই প্রতিযোগিতা নিয়ে একটি নতুন দৃষ্টিকোণ: ২০২৫ ওলামা ডেপ্লয়মেন্ট তুলনা এবং গ্লোবাল এআই মডেল ট্রেন্ডের অন্তর্দৃষ্টি (A New Perspective on the US-China AI Race: 2025 Ollama Deployment Comparison and Global AI Model Trend Insights)
ওলামা একটি জনপ্রিয় ওপেন-সোর্স টুল যা স্থানীয়ভাবে বৃহৎ ভাষার মডেল (LLMs) চালানো, তৈরি এবং শেয়ার করার প্রক্রিয়াটিকে সহজ করার জন্য ডিজাইন করা হয়েছে। এটি মডেল ওয়েট, কনফিগারেশন এবং ডেটাকে একটি প্যাকেজে বান্ডিল করে যা একটি মডেলফাইল দ্বারা সংজ্ঞায়িত করা হয়, এবং এই মডেলগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য একটি এপিআই সরবরাহ করে। এটি ডেভেলপার এবং গবেষকদের ব্যক্তিগত কম্পিউটার বা সার্ভারে বিভিন্ন উন্নত এআই মডেল সহজে স্থাপন এবং পরীক্ষা করার সুযোগ করে দেয়।
১. ভূমিকা (Introduction)
ওলামা একটি জনপ্রিয় ওপেন-সোর্স টুল যা স্থানীয়ভাবে বৃহৎ ভাষার মডেল (LLMs) চালানো, তৈরি এবং শেয়ার করার প্রক্রিয়াটিকে সহজ করার জন্য ডিজাইন করা হয়েছে। এটি মডেল ওয়েট, কনফিগারেশন এবং ডেটাকে একটি প্যাকেজে বান্ডিল করে যা একটি মডেলফাইল দ্বারা সংজ্ঞায়িত করা হয়, এবং এই মডেলগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য একটি এপিআই সরবরাহ করে। এটি ডেভেলপার এবং গবেষকদের ব্যক্তিগত কম্পিউটার বা সার্ভারে বিভিন্ন উন্নত এআই মডেল সহজে স্থাপন এবং পরীক্ষা করার সুযোগ করে দেয়।
এই প্রতিবেদনের লক্ষ্য হলো বিশ্বব্যাপী স্থাপন করা ১,৭৪,৫৯০টি ওলামা ইনস্ট্যান্স থেকে ডেটা বিশ্লেষণ করে ডেপ্লয়মেন্ট প্রবণতা, মডেল পছন্দ, ভৌগোলিক বিতরণ এবং নেটওয়ার্ক বৈশিষ্ট্যগুলি প্রকাশ করা।
দ্রষ্টব্য: অধ্যায় ৫ এবং অধ্যায় ৭-এর ডেটা পরিসংখ্যান সমস্ত ১,৭৪,৫৯০টি ইনস্ট্যান্স থেকে সংগ্রহ করা হয়েছে। অধ্যায় ৬-এর ডেটা অ্যাক্সেসযোগ্য ইনস্ট্যান্স থেকে সংগ্রহ করা হয়েছে। নিরাপত্তার কারণে, আমরা ওলামা সংস্করণগুলির পরিসংখ্যান তালিকাভুক্ত করিনি।
ডেটা সংগ্রহ截至: ২৪ এপ্রিল, ২০২৫।
প্রতিবেদনের উৎস: Tenthe AI https://tenthe.com
লেখক: রায়ান
২. নির্বাহী সারসংক্ষেপ (Executive Summary)
এই প্রতিবেদনটি বিশ্বব্যাপী সর্বজনীনভাবে উপলব্ধ ওলামা ইনস্ট্যান্সগুলির স্ক্যান ডেটা এবং এপিআই প্রোবিং বিশ্লেষণের উপর ভিত্তি করে তৈরি। মূল অনুসন্ধানগুলির মধ্যে রয়েছে:
বিশ্বব্যাপী, ফোফা (Fofa) দ্বারা প্রাথমিকভাবে চিহ্নিত প্রায় ১,৭৪,৫৯০টি রেকর্ডের মধ্যে (৯৯,৪১২ স্বতন্ত্র আইপি), ৪১,০২১টি ওলামা ইনস্ট্যান্সের অ্যাক্সেসযোগ্য এপিআই সফলভাবে প্রোব করা হয়েছে, যা ২৪,০৩৮টি স্বতন্ত্র আইপি ঠিকানায় বিতরণ করা হয়েছে (অ্যাক্সেসযোগ্যতার হার প্রায় ২৪.১৮%)।
ভৌগোলিকভাবে, মার্কিন যুক্তরাষ্ট্র এবং চীন হলো সেই দেশ যেখানে ওলামা ডেপ্লয়মেন্টের সংখ্যা সর্বাধিক। ক্লাউড পরিষেবা প্রদানকারী, বিশেষত এডব্লিউএস (AWS), আলিবাবা ক্লাউড এবং টেনসেন্ট ক্লাউড, ওলামা ইনস্ট্যান্সগুলির প্রাথমিক হোস্ট।
মডেল ডেপ্লয়মেন্টে বৈচিত্র্য দেখা যায়, যেখানে
llama3
,deepseek-r1
,mistral
, এবংqwen
সিরিজের মডেলগুলি ব্যাপকভাবে জনপ্রিয়। এদের মধ্যে,llama3:latest
এবংdeepseek-r1:latest
হলো দুটি সর্বাধিক ব্যাপকভাবে স্থাপন করা মডেল ট্যাগ।৭বি-৮বি প্যারামিটারের মডেলগুলি ব্যবহারকারীদের শীর্ষ পছন্দ, যেখানে Q4_K_M এবং Q4_0 এর মতো ৪-বিট কোয়ান্টাইজড মডেলগুলি তাদের পারফরম্যান্স এবং রিসোর্স খরচের মধ্যে ভালো ভারসাম্যের জন্য ব্যাপকভাবে গৃহীত হয়েছে।
ডিফল্ট পোর্ট
11434
সর্বাধিক ব্যবহৃত হয়, এবং বেশিরভাগ ইনস্ট্যান্স HTTP প্রোটোকলের মাধ্যমে পরিষেবাগুলি প্রকাশ করে।
৩. ডেটা উৎস এবং পদ্ধতি (Data Sources and Methodology)
এই প্রতিবেদনের জন্য ডেটা মূলত দুটি পর্যায় থেকে এসেছে: ১. প্রাথমিক স্ক্যান: নেটওয়ার্ক স্পেস সার্চ ইঞ্জিন যেমন ফোফা (Fofa) ব্যবহার করে, app="Ollama" && is_domain=false
শর্তের সাথে, বিশ্বব্যাপী স্থাপন করা সম্ভাব্য ওলামা ইনস্ট্যান্সগুলি প্রাথমিকভাবে সনাক্ত করা। এই পর্যায়ে ১,৭৪,৫৯০টি রেকর্ড পাওয়া গেছে, যেখানে ডিডুপ্লিকেশনের পরে ৯৯,৪১২টি স্বতন্ত্র আইপি জড়িত। ২. এপিআই যাচাইকরণ এবং ডেটা সমৃদ্ধকরণ: প্রাথমিকভাবে স্ক্যান করা আইপি ঠিকানাগুলির জন্য ip:port/api/tags
এপিআই এন্ডপয়েন্ট প্রোব করে ওলামা পরিষেবাগুলির অ্যাক্সেসযোগ্যতা নিশ্চিত করা এবং স্থাপন করা নির্দিষ্ট এআই মডেলগুলি সম্পর্কে তথ্য প্রাপ্ত করা। এই পর্যায়ে ৪১,০২১টি সফলভাবে প্রতিক্রিয়াশীল ওলামা ইনস্ট্যান্স নিশ্চিত করা হয়েছে ( ২৪,০৩৮টি স্বতন্ত্র আইপি থেকে, ollama
টেবিলে ডেটা সংরক্ষিত)। ৩. চূড়ান্ত ডেটা ollama
টেবিলে সংরক্ষণ করা হয়।
এই প্রতিবেদনের বিশ্লেষণ মূলত ollama
টেবিলের ডেটার উপর ভিত্তি করে, যেখানে সফলভাবে প্রোব করা এপিআই এবং তাদের বিস্তারিত তথ্য, যেমন আইপি, পোর্ট, ভৌগোলিক অবস্থান এবং JSON প্রতিক্রিয়া (মডেল তালিকা সম্বলিত) ইত্যাদি রেকর্ড রয়েছে।
৪. সামগ্রিক ডেপ্লয়মেন্ট পরিসংখ্যান (Overall Deployment Statistics)
ফোফা স্ক্যান থেকে প্রাথমিক রেকর্ডের সংখ্যা: ১,৭৪,৫৯০
ফোফা প্রাথমিক স্ক্যান থেকে স্বতন্ত্র আইপি-র সংখ্যা: ৯৯,৪১২
/api/tags
সফলভাবে অ্যাক্সেস করা ওলামা ইনস্ট্যান্সের সংখ্যা: ৪১,০২১ (ollama
টেবিলেstatus = 'success'
থাকা রেকর্ড থেকে)সংশ্লিষ্ট স্বতন্ত্র আইপি ঠিকানার সংখ্যা: ২৪,০৩৮ (
ollama
টেবিলেstatus = 'success'
থাকা রেকর্ড থেকে)প্রাথমিকভাবে চিহ্নিত আইপি-র সাথে অ্যাক্সেসযোগ্য আইপি-র অনুপাত: (২৪০৩৮ / ৯৯৪১২) * ১০০% ≈ ২৪.১৮%
এটি নির্দেশ করে যে ফোফা দ্বারা চিহ্নিত সমস্ত ওলামা ইনস্ট্যান্সগুলির মধ্যে প্রায় এক চতুর্থাংশের /api/tags
ইন্টারফেস সর্বজনীনভাবে অ্যাক্সেসযোগ্য, যা আমাদের তাদের স্থাপন করা মডেলগুলি সম্পর্কে তথ্য পুনরুদ্ধার করতে দেয়।
৫. ভৌগোলিক বিতরণ বিশ্লেষণ (Geographical Distribution Analysis)
৫.১ শীর্ষ ২০টি ডেপ্লয়মেন্ট দেশ/অঞ্চল (Top 20 Deployment Countries/Regions)
নীচের সারণীটি ওলামা ইনস্ট্যান্স সহ স্বতন্ত্র আইপি-র সংখ্যা অনুসারে শীর্ষ ২০টি দেশ/অঞ্চল দেখাচ্ছে।
র্যাঙ্ক | দেশ/অঞ্চল | স্বতন্ত্র আইপি গণনা |
---|---|---|
1 | মার্কিন যুক্তরাষ্ট্র | 29195 |
2 | চীন | 16464 |
3 | জাপান | 5849 |
4 | জার্মানি | 5438 |
5 | যুক্তরাজ্য | 4014 |
6 | ভারত | 3939 |
7 | সিঙ্গাপুর | 3914 |
8 | দক্ষিণ কোরিয়া | 3773 |
9 | আয়ারল্যান্ড | 3636 |
10 | ফ্রান্স | 3599 |
11 | অস্ট্রেলিয়া | 3558 |
12 | ব্রাজিল | 2909 |
13 | কানাডা | 2763 |
14 | দক্ষিণ আফ্রিকা | 2742 |
15 | সুইডেন | 2113 |
16 | হংকং এসএআর, চীন | 1277 |
17 | ইসরায়েল | 675 |
18 | তাইওয়ান, চীন | 513 |
19 | রাশিয়া | 475 |
20 | ফিনল্যান্ড | 308 |

৫.২ শীর্ষ ২০টি গ্লোবাল সিটি ডেপ্লয়মেন্ট (Top 20 Global City Deployments)
নীচের সারণীটি ওলামা ইনস্ট্যান্স সহ স্বতন্ত্র আইপি-র সংখ্যা অনুসারে বিশ্বব্যাপী শীর্ষ ২০টি শহর দেখাচ্ছে।
র্যাঙ্ক | শহর | দেশ/অঞ্চল | স্বতন্ত্র আইপি গণনা |
---|---|---|---|
1 | অ্যাশবার্ন | মার্কিন যুক্তরাষ্ট্র | 5808 |
2 | পোর্টল্যান্ড | মার্কিন যুক্তরাষ্ট্র | 5130 |
3 | সিঙ্গাপুর | সিঙ্গাপুর | 3914 |
4 | ফ্রাঙ্কফুর্ট অ্যাম মেইন | জার্মানি | 3908 |
5 | বেইজিং | চীন | 3906 |
6 | লন্ডন | যুক্তরাজ্য | 3685 |
7 | কলম্বাস | মার্কিন যুক্তরাষ্ট্র | 3672 |
8 | মুম্বাই | ভারত | 3637 |
9 | ডাবলিন | আয়ারল্যান্ড | 3631 |
10 | টোকিও | জাপান | 3620 |
11 | সিডনি | অস্ট্রেলিয়া | 3487 |
12 | প্যারিস | ফ্রান্স | 3175 |
13 | সান হোসে | মার্কিন যুক্তরাষ্ট্র | 2815 |
14 | সাও পাওলো | ব্রাজিল | 2753 |
15 | কেপ টাউন | দক্ষিণ আফ্রিকা | 2692 |
16 | মন্ট্রিল | কানাডা | 2535 |
17 | সিয়াটল | মার্কিন যুক্তরাষ্ট্র | 2534 |
18 | হ্যাংঝৌ | চীন | 2447 |
19 | সিউল | দক্ষিণ কোরিয়া | 2327 |
20 | ওসাকা | জাপান | 2184 |
৫.৩ শীর্ষ ১০টি মার্কিন শহর বিতরণ (Top 10 US City Distribution)
র্যাঙ্ক | শহর | স্বতন্ত্র আইপি গণনা |
---|---|---|
1 | অ্যাশবার্ন | 5808 |
2 | পোর্টল্যান্ড | 5130 |
3 | কলম্বাস | 3672 |
4 | সান হোসে | 2815 |
5 | সিয়াটল | 2534 |
6 | ওয়েস্টলেক ভিলেজ | 1714 |
7 | বোর্ডম্যান | 855 |
8 | ফ্লোরেন্স | 776 |
9 | সান ফ্রান্সিসকো | 753 |
10 | বোল্ডার | 642 |

৫.৪ শীর্ষ ১০টি চীনের মূল ভূখণ্ড শহর বিতরণ (Top 10 Mainland China City Distribution)
হংকং এবং তাইওয়ানের ডেপ্লয়মেন্টগুলি শীর্ষ ১০টি শহরের সারণীতে প্রতিফলিত হয়নি কারণ সেগুলি ইতিমধ্যে দেশ/অঞ্চল পরিসংখ্যানে অন্তর্ভুক্ত রয়েছে।
র্যাঙ্ক | শহর | দেশ ( | স্বতন্ত্র আইপি গণনা |
---|---|---|---|
1 | বেইজিং | চীন | 3906 |
2 | হ্যাংঝৌ | চীন | 2447 |
3 | সাংহাই | চীন | 1335 |
4 | গুয়াংঝৌ | চীন | 1296 |
5 | শেনঝেন | চীন | 768 |
6 | চেংদু | চীন | 469 |
7 | নানজিং | চীন | 329 |
8 | চংকিং | চীন | 259 |
9 | সুঝৌ | চীন | 257 |
10 | উহান | চীন | 249 |

৫.৫ মার্কিন-চীন শীর্ষ ১০টি শহর ডেপ্লয়মেন্ট তুলনা (US-China Top 10 City Deployment Comparison)
মার্কিন যুক্তরাষ্ট্র এবং চীনে শহর পর্যায়ে ওলামা ডেপ্লয়মেন্টগুলি আরও স্বজ্ঞাতভাবে তুলনা করার জন্য, নীচের সারণীটি উভয় দেশের শীর্ষ ১০টি শহরের জন্য স্বতন্ত্র আইপি ডেপ্লয়মেন্ট গণনার তুলনা করে:
র্যাঙ্ক | মার্কিন শহর (শীর্ষ ১০) | মার্কিন স্বতন্ত্র আইপি গণনা | চীনা শহর (শীর্ষ ১০) | চীনা স্বতন্ত্র আইপি গণনা |
---|---|---|---|---|
1 | অ্যাশবার্ন | 5808 | বেইজিং | 3906 |
2 | পোর্টল্যান্ড | 5130 | হ্যাংঝৌ | 2447 |
3 | কলম্বাস | 3672 | সাংহাই | 1335 |
4 | সান হোসে | 2815 | গুয়াংঝৌ | 1296 |
5 | সিয়াটল | 2534 | শেনঝেন | 768 |
6 | ওয়েস্টলেক ভিলেজ | 1714 | চেংদু | 469 |
7 | বোর্ডম্যান | 855 | নানজিং | 329 |
8 | ফ্লোরেন্স | 776 | চংকিং | 259 |
9 | সান ফ্রান্সিসকো | 753 | সুঝৌ | 257 |
10 | বোল্ডার | 642 | উহান | 249 |

সংক্ষিপ্ত মন্তব্য:
শীর্ষস্থানীয় শহরের পরিমাণ: মার্কিন যুক্তরাষ্ট্রের শীর্ষ ৩টি শহরে (অ্যাশবার্ন, পোর্টল্যান্ড, কলম্বাস) প্রতিটিতে ৩,০০০-এর বেশি স্বতন্ত্র আইপি-তে ওলামা ডেপ্লয়মেন্ট রয়েছে। চীনের শীর্ষ শহর (বেইজিং) এ ৩,০০০-এর বেশি ডেপ্লয়মেন্ট এবং এর দ্বিতীয় শহর (হ্যাংঝৌ) তে ২,০০০-এর বেশি ডেপ্লয়মেন্ট রয়েছে।
প্রযুক্তি এবং অর্থনৈতিক কেন্দ্র: উভয় দেশের তালিকাভুক্ত অনেক শহরই সুপরিচিত প্রযুক্তি উদ্ভাবন কেন্দ্র বা গুরুত্বপূর্ণ অর্থনৈতিক অঞ্চল।
ডেটা সেন্টার অঞ্চল: অ্যাশবার্নের মতো মার্কিন শহরগুলির অন্তর্ভুক্তি এটাও প্রতিফলিত করে যে ওলামা ইনস্ট্যান্সগুলি মূলত ক্লাউড সার্ভার এবং ডেটা সেন্টারগুলির মধ্যে স্থাপন করা হতে পারে।
বিতরণ পার্থক্য: সামগ্রিকভাবে, মার্কিন শীর্ষ ১০টি শহরের মোট আইপি সংখ্যা চীনের শীর্ষ ১০টি শহরের তুলনায় উল্লেখযোগ্যভাবে বেশি। তবে, উভয় দেশেই এমন একটি প্যাটার্ন দেখা যায় যেখানে কয়েকটি মূল শহর ওলামা ডেপ্লয়মেন্টের সিংহভাগ দখল করে আছে।
এই শহর-স্তরের তুলনা আরও প্রকাশ করে যে ওলামার প্রচার এবং প্রয়োগ, একটি ডেভেলপার টুল হিসাবে, আঞ্চলিক প্রযুক্তিগত বাস্তুতন্ত্র এবং শিল্প উন্নয়নের সাথে ঘনিষ্ঠভাবে জড়িত।
৬. মডেল বিশ্লেষণ (Model Analysis)
৬.১ এআই মডেল, প্যারামিটার এবং কোয়ান্টাইজেশনের সংক্ষিপ্ত বিবরণ (Brief Overview of AI Models, Parameters, and Quantization)
ওলামা বিভিন্ন ধরনের ওপেন-সোর্স বৃহৎ ভাষার মডেল সমর্থন করে। এই মডেলগুলি সাধারণত নিম্নলিখিত বৈশিষ্ট্য দ্বারা পৃথক করা হয়:
৬.১.১ সাধারণ মডেল পরিবার (Common Model Families)
বর্তমান ওপেন-সোর্স কমিউনিটিতে চমৎকার এলএলএম পরিবারের একটি উত্থান দেখা গেছে, যার প্রতিটির নিজস্ব বৈশিষ্ট্য রয়েছে:
লামা সিরিজ (মেটা এআই): যেমন লামা ২, লামা ৩, কোড লামা। এর শক্তিশালী সাধারণ ক্ষমতা এবং ব্যাপক কমিউনিটি সমর্থনের জন্য পরিচিত, যার ফলে অসংখ্য ফাইন-টিউনড সংস্করণ তৈরি হয়েছে। আমাদের ডেটাতে দেখা
llama3.1
,hermes3
এর মতো মডেলগুলি প্রায়শই লামা আর্কিটেকচারের উপর ভিত্তি করে তৈরি।মিস্ট্রাল সিরিজ (মিস্ট্রাল এআই): যেমন মিস্ট্রাল ৭বি, মিক্সট্রাল ৮x৭বি। দক্ষতা এবং উচ্চ কার্যকারিতার জন্য মনোযোগ আকর্ষণ করছে, বিশেষত এর MoE (মিক্সচার অফ এক্সপার্টস) মডেলগুলি।
জেমা সিরিজ (গুগল): যেমন জেমা ২বি, জেমা ৭বি। গুগল দ্বারা প্রকাশিত ওপেন-ওয়েট মডেল, তাদের আরও শক্তিশালী জেমিনি মডেল থেকে প্রাপ্ত প্রযুক্তি সহ।
ফাই সিরিজ (মাইক্রোসফট): যেমন ফাই-২, ফাই-৩। ছোট আকারের অথচ সক্ষম মডেলগুলিতে ফোকাস করে, "এসএলএম (ছোট ভাষার মডেল)" এর উপর জোর দেয়।
ডিপসিক সিরিজ (ডিপসিক এআই): যেমন ডিপসিক কোডার, ডিপসিক এলএলএম। চীনা এআই মডেল যা কোডিং এবং সাধারণ কাজগুলিতে পারদর্শী।
কোয়েন সিরিজ (আলিবাবা টংই কিয়ানওয়েন): যেমন কোয়েন১.৫। আলিবাবা ডামো একাডেমি কর্তৃক চালু করা মডেলগুলির একটি সিরিজ, একাধিক ভাষা এবং কাজ সমর্থন করে।
আরও অনেক চমৎকার মডেল রয়েছে, যেমন यी (01.AI), কমান্ড আর (Cohere) ইত্যাদি।
ওলামা, তার Modelfile
পদ্ধতির মাধ্যমে, ব্যবহারকারীদের এই বেস মডেলগুলি বা তাদের ফাইন-টিউনড সংস্করণগুলি সহজে ব্যবহার করতে দেয়। মডেলের নামগুলি প্রায়শই পরিবার:আকার-ভেরিয়েন্ট-কোয়ান্টাইজেশন
ফরম্যাট অনুসরণ করে, উদাহরণস্বরূপ, llama3:8b-instruct-q4_K_M
।
৬.১.২ মডেল প্যারামিটার (প্যারামিটারের আকার) (Model Parameters (Parameter Size))
মডেল প্যারামিটারের সংখ্যা (সাধারণত বি - বিলিয়ন; বা এম - মিলিয়ন) একটি মডেলের স্কেল এবং সম্ভাব্য ক্ষমতার একটি গুরুত্বপূর্ণ সূচক। সাধারণ প্যারামিটারের আকারগুলির মধ্যে রয়েছে:
ছোট মডেল: < ৭বি (যেমন, ১.৫বি, ২বি, ৩বি)। সাধারণত কম রিসোর্স খরচে দ্রুত চলে, নির্দিষ্ট কাজ বা রিসোর্স-সীমাবদ্ধ পরিবেশের জন্য উপযুক্ত।
মাঝারি মডেল: ৭বি, ৮বি, ১৩বি। ক্ষমতা এবং রিসোর্স খরচের মধ্যে একটি ভাল ভারসাম্য অর্জন করে, বর্তমানে কমিউনিটিতে সবচেয়ে জনপ্রিয় আকারগুলির মধ্যে একটি।
বড় মডেল: ৩০বি, ৩৩বি, ৪০বি, ৭০বি+। সাধারণত আরও সক্ষম তবে আরও বেশি গণনামূলক সম্পদ (র্যাম, ভিআরএএম) এবং দীর্ঘ অনুমান সময় প্রয়োজন।
আমাদের ডেটাতে parameter_size
ক্ষেত্র (যেমন, "8.0B", "7B", "134.52M") এটি নির্দেশ করে।
৬.১.৩ কোয়ান্টাইজেশন সংস্করণ (কোয়ান্টাইজেশন স্তর) (Quantization Versions (Quantization Level))
কোয়ান্টাইজেশন হলো মডেলের ওজনগুলির সংখ্যাসূচক নির্ভুলতা হ্রাস করে (যেমন, ১৬-বিট ফ্লোটিং-পয়েন্ট FP16 থেকে ৪-বিট পূর্ণসংখ্যা INT4) মডেলের আকার হ্রাস এবং অনুমান ত্বরান্বিত করার একটি কৌশল।
সাধারণ কোয়ান্টাইজেশন স্তর: ওলামা এবং জিজেইউএফ (GGUF) ফরম্যাট (লামা.সিপিপি দ্বারা ব্যবহৃত) বিভিন্ন কোয়ান্টাইজেশন কৌশল সমর্থন করে, যেমন
Q2_K
,Q3_K_S
,Q3_K_M
,Q3_K_L
,Q4_0
,Q4_K_M
,Q5_K_M
,Q6_K
,Q8_0
ইত্যাদি।সংখ্যা (যেমন, ২, ৩, ৪, ৫, ৬, ৮) মোটামুটিভাবে বিটের সংখ্যা নির্দেশ করে।
K
সিরিজের কোয়ান্টাইজেশন (যেমন,Q4_K_M
) হলো লামা.সিপিপি-তে প্রবর্তিত উন্নত কোয়ান্টাইজেশন পদ্ধতি, যা সাধারণত একই বিট সংখ্যায় উন্নত কর্মক্ষমতা অর্জন করে।_S
,_M
,_L
সাধারণত K-কোয়ান্টের বিভিন্ন রূপ নির্দেশ করে, যা মডেলের বিভিন্ন অংশকে প্রভাবিত করে।F16
(FP16) ১৬-বিট ফ্লোটিং-পয়েন্ট প্রতিনিধিত্ব করে, প্রায়শই অ-কোয়ান্টাইজড বা একটি বেস কোয়ান্টাইজেশন সংস্করণ হিসাবে বিবেচিত হয়।F32
(FP32) হলো পূর্ণ নির্ভুলতা।
ট্রেড-অফ: উচ্চতর কোয়ান্টাইজেশন (কম বিট সংখ্যা) ছোট, দ্রুত মডেলের দিকে পরিচালিত করে, তবে সাধারণত কিছু কর্মক্ষমতা হ্রাস পায় (মডেল খারাপ পারফর্ম করে)। ব্যবহারকারীদের তাদের হার্ডওয়্যার এবং মডেলের গুণমানের প্রয়োজনীয়তার উপর ভিত্তি করে পছন্দ করতে হবে।
আমাদের ডেটাতে quantization_level
ক্ষেত্র (যেমন, "Q4_K_M", "F16") এটি নির্দেশ করে।
৬.২ শীর্ষ জনপ্রিয় মডেলের নাম (Top Popular Model Names)
নীচের সারণীটি স্বতন্ত্র আইপি ডেপ্লয়মেন্টের সংখ্যা অনুসারে শীর্ষ ১০টি মডেল ট্যাগ দেখাচ্ছে, যার মধ্যে তাদের পরিবার, প্যারামিটারের আকার এবং কোয়ান্টাইজেশন স্তরের তথ্য অন্তর্ভুক্ত রয়েছে।
র্যাঙ্ক | মডেলের নাম (model_name) | স্বতন্ত্র আইপি ডেপ্লয়মেন্ট | মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স |
---|---|---|---|
1 |
| 12659 | 24628 |
2 |
| 12572 | 24578 |
3 |
| 11163 | 22638 |
4 |
| 9868 | 21007 |
5 |
| 9845 | 20980 |
6 |
| 4058 | 5016 |
7 |
| 3124 | 3928 |
8 |
| 2856 | 3372 |
9 |
| 2714 | 3321 |
10 |
| 2668 | 3391 |

(দ্রষ্টব্য: স্বতন্ত্র আইপি ডেপ্লয়মেন্ট বলতে সেইসব স্বতন্ত্র আইপি ঠিকানার সংখ্যা বোঝায় যেখানে এই মডেল ট্যাগের অন্তত একটি ইনস্ট্যান্স স্থাপন করা হয়েছে। মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স বলতে সমস্ত আইপি জুড়ে models
তালিকায় এই মডেল ট্যাগটি যতবার উপস্থিত হয়েছে তার মোট সংখ্যা বোঝায়। একটি আইপি বিভিন্ন উপায়ে বা রেকর্ডের মাধ্যমে একই মডেল ট্যাগের দিকে নির্দেশ করতে পারে, অথবা একটি আইপি একই বেস মডেলের বিভিন্ন ট্যাগের একাধিক ইনস্ট্যান্স চালাতে পারে।)
প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় মডেলের নাম):
:latest
ট্যাগযুক্ত মডেলগুলি খুব সাধারণ, যেমনllama3:latest
,deepseek-r1:latest
,mistral:latest
,qwen:latest
। এটি নির্দেশ করে যে অনেক ব্যবহারকারী সরাসরি মডেলগুলির সর্বশেষ সংস্করণ পুল করতে পছন্দ করেন।লামা সিরিজের মডেলগুলি (যেমন,
llama3:latest
,llama3:8b-text-q4_K_S
,llama2:latest
,llama3.1:8b
) একাধিক স্থান দখল করে আছে, যা তাদের শক্তিশালী জনপ্রিয়তা দেখায়।চীনা এআই মডেল যেমন
deepseek-r1:latest
(ডিপসিক সিরিজ) এবংqwen:latest
(টংই কিয়ানওয়েন সিরিজ) ও চিত্তাকর্ষক পারফরম্যান্স দেখিয়েছে, উচ্চ র্যাঙ্কিংয়ে রয়েছে।llama3:8b-text-q4_K_S
এর মতো নির্দিষ্ট কোয়ান্টাইজড সংস্করণগুলিও শীর্ষ দশে স্থান পেয়েছে, যা নির্দিষ্ট কর্মক্ষমতা/রিসোর্স খরচের ভারসাম্যের প্রতি ব্যবহারকারীর পছন্দ নির্দেশ করে।smollm2:135m
এবংqwen2.5:1.5b
এর মতো ছোট মডেলগুলিরও যথেষ্ট সংখ্যক ডেপ্লয়মেন্ট রয়েছে, যা লাইটওয়েট মডেলের চাহিদা পূরণ করে।
৬.৩ শীর্ষ মডেল পরিবার (Top Model Families)
মডেল পরিবার (details.family
ক্ষেত্র) মডেলের বেস আর্কিটেকচার বা প্রাথমিক প্রযুক্তিগত বংশ নির্দেশ করে। নীচে আমাদের ডেটা বিশ্লেষণের ভিত্তিতে উচ্চ সংখ্যক ডেপ্লয়মেন্ট সহ মডেল পরিবারগুলি রয়েছে:
র্যাঙ্ক | মডেল পরিবার (family) | স্বতন্ত্র আইপি ডেপ্লয়মেন্ট (আনুমানিক) | মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স (আনুমানিক) |
---|---|---|---|
1 |
| ~20250 | ~103480 |
2 |
| ~17881 | ~61452 |
3 |
| ~1479 | ~1714 |
4 |
| ~1363 | ~2493 |
5 |
| ~1228 | ~2217 |
6 |
| ~943 | ~1455 |
7 |
| ~596 | ~750 |
8 |
| ~484 | ~761 |
9 |
| ~368 | ~732 |
10 |
| ~244 | ~680 |

(দ্রষ্টব্য: এখানে নির্দিষ্ট মানগুলি আনুমানিক এবং পূর্বে জিজ্ঞাসিত শীর্ষ ৫০টি মডেলের বিশদ তালিকার উপর ভিত্তি করে সংক্ষিপ্ত করা হয়েছে এবং সুনির্দিষ্ট বৈশ্বিক পরিসংখ্যান থেকে সামান্য ভিন্ন হতে পারে, তবে প্রবণতাটি প্রতিনিধিত্বমূলক।)
প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় মডেল পরিবার):
llama
পরিবার একটি সম্পূর্ণ প্রভাবশালী অবস্থানে রয়েছে, যা লামা সিরিজের মডেলগুলির অনেক আধুনিক ওপেন-সোর্স এলএলএম-এর ভিত্তি এবং তাদের নিজস্ব ব্যাপক প্রয়োগের সাথে সামঞ্জস্যপূর্ণ। এর বিশাল ইকোসিস্টেম এবং অসংখ্য ফাইন-টিউনড সংস্করণ এটিকে সবচেয়ে জনপ্রিয় পছন্দ করে তুলেছে।qwen2
(টংই কিয়ানওয়েন কোয়েন২ সিরিজ), দ্বিতীয় বৃহত্তম পরিবার হিসাবে, চীন এবং এমনকি বিশ্বব্যাপী তার শক্তিশালী প্রতিযোগিতা দেখায়।nomic-bert
এবংbert
এর উপস্থিতি উল্লেখযোগ্য। যদিও এগুলি সাধারণত "বৃহৎ ভাষার মডেল" (কথোপকথনমূলক) হিসাবে বিবেচিত হয় না, বরং টেক্সট এম্বেডিং বা অন্যান্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ বেস মডেল, তাদের উচ্চ ডেপ্লয়মেন্ট ভলিউম থেকে বোঝা যায় যে ওলামা এই ধরনের কাজের জন্যও ব্যাপকভাবে ব্যবহৃত হয়। ওলামা নির্দিষ্ট অপারেশন (যেমন এম্বেডিং ভেক্টর তৈরি করা) করার সময় স্বয়ংক্রিয়ভাবে একটি ডিফল্ট এম্বেডিং মডেল (যেমন,nomic-embed-text
) ডাউনলোড করে, যা সম্ভবত এই পরিবারগুলির উচ্চ র্যাঙ্কিংয়ের প্রধান কারণ।গুগলের
gemma
সিরিজ (gemma3
,gemma
,gemma2
সহ) ও গ্রহণযোগ্য গ্রহণের হার দেখায়।deepseek2
এবংphi3
এর মতো অন্যান্য সুপরিচিত মডেল পরিবারগুলিও শীর্ষ দশে স্থান পেয়েছে।mllama
বিভিন্ন লামা-ভিত্তিক হাইব্রিড, পরিবর্তিত, বা কমিউনিটি-নামকরণ করা মডেলগুলির একটি সংগ্রহ উপস্থাপন করতে পারে।
৬.৪ শীর্ষ মূল প্যারামিটার আকারের পরিসংখ্যান (Top Original Parameter Size Statistics)
মডেল প্যারামিটারের আকার (details.parameter_size
ক্ষেত্র) মডেল স্কেলের একটি গুরুত্বপূর্ণ সূচক। কাঁচা ডেটাতে প্যারামিটারের আকারের বিভিন্ন উপস্থাপনার কারণে (যেমন, "8.0B", "7B", "134.52M"), আমরা সরাসরি এই মূল স্ট্রিংগুলি গণনা করি। নীচে উচ্চ সংখ্যক ডেপ্লয়মেন্ট সহ প্যারামিটার আকারের উপস্থাপনাগুলি রয়েছে:
র্যাঙ্ক | প্যারামিটারের আকার (মূল স্ট্রিং) | স্বতন্ত্র আইপি ডেপ্লয়মেন্ট (আনুমানিক) | মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স (আনুমানিক) |
---|---|---|---|
1 |
| ~14480 | ~52577 |
2 |
| ~14358 | ~28105 |
3 |
| ~11233 | ~22907 |
4 |
| ~9895 | ~21058 |
5 |
| ~4943 | ~11738 |
6 |
| ~4062 | ~5266 |
7 |
| ~2759 | ~3596 |
8 |
| ~2477 | ~3311 |
9 |
| ~2034 | ~2476 |
10 |
| ~1553 | ~2244 |
11 |
| ~1477 | ~1708 |
12 |
| ~1421 | ~2000 |
13 |
| ~1254 | ~2840 |
14 |
| ~1123 | ~2091 |
15 |
| ~943 | ~1194 |

(দ্রষ্টব্য: মানগুলি পূর্বে জিজ্ঞাসিত শীর্ষ ৫০টি মডেলের বিশদ তালিকা থেকে প্যারামিটার তথ্যের একটি সারাংশের উপর ভিত্তি করে আনুমানিক করা হয়েছে।)
প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় প্যারামিটার আকার):
৭বি থেকে ৮বি স্কেলের মডেলগুলি হলো সম্পূর্ণ মূলস্রোত: "8.0B", "7.6B", "7.2B", "7B" ডেপ্লয়মেন্টের সিংহভাগ দখল করে আছে। এটি সাধারণত কমিউনিটিতে খুব জনপ্রিয় মডেলগুলির সাথে সঙ্গতিপূর্ণ, যেমন লামা ২/৩ ৭বি/৮বি সিরিজ, মিস্ট্রাল ৭বি, এবং তাদের বিভিন্ন ফাইন-টিউনড সংস্করণ। এগুলি কর্মক্ষমতা এবং রিসোর্স খরচের মধ্যে একটি ভাল ভারসাম্য বজায় রাখে।
৪বি স্কেলের মডেলগুলিও একটি গুরুত্বপূর্ণ অবস্থানে রয়েছে: "4B" এর উচ্চ ডেপ্লয়মেন্ট উল্লেখযোগ্য।
মিলিয়ন-প্যারামিটার স্তরের (এম) লাইটওয়েট মডেলগুলি ব্যাপক: "134.52M" এবং "137M" এর উচ্চ র্যাঙ্কিং সম্ভবত এম্বেডিং মডেলগুলির (যেমন
nomic-embed-text
) জনপ্রিয়তা বা খুব ছোট বিশেষায়িত মডেলগুলির (যেমনsmollm
সিরিজ) সাথে সম্পর্কিত। এই মডেলগুলি ছোট, দ্রুত, এবং রিসোর্স-সীমাবদ্ধ বা লেটেন্সি-সংবেদনশীল পরিস্থিতির জন্য উপযুক্ত।১বি-৪বি পরিসরে ছোট মডেলগুলির স্থিতিশীল চাহিদা: "1.5B", "1.8B", "3.2B", "4.3B" এর মতো প্যারামিটার আকারের মডেলগুলিও ব্যবহারকারীদের একটি অংশের কাছে প্রিয়।
১০বি-এর উপরে বড় মডেল: যেমন "13B", "12.2B", "32.8B", "14.8B", যদিও ৭-৮বি স্তরের মতো এতগুলি স্বতন্ত্র আইপি ডেপ্লয়মেন্ট নেই, তবুও তাদের যথেষ্ট ডেপ্লয়মেন্ট ভলিউম রয়েছে, যা আরও সক্ষম মডেলের জন্য একটি কমিউনিটি চাহিদা নির্দেশ করে, তাদের উচ্চ হার্ডওয়্যার প্রয়োজনীয়তা সত্ত্বেও।
৬.৫ শীর্ষ কোয়ান্টাইজেশন স্তর পরিসংখ্যান (Top Quantization Level Statistics)
মডেল কোয়ান্টাইজেশন স্তর (details.quantization_level
ক্ষেত্র) মডেলের আকার হ্রাস এবং অনুমান ত্বরান্বিত করার জন্য মডেল দ্বারা গৃহীত ওজন নির্ভুলতা প্রতিফলিত করে। নীচে উচ্চ সংখ্যক ডেপ্লয়মেন্ট সহ কোয়ান্টাইজেশন স্তরগুলি রয়েছে:
র্যাঙ্ক | কোয়ান্টাইজেশন স্তর (মূল স্ট্রিং) | স্বতন্ত্র আইপি ডেপ্লয়মেন্ট (আনুমানিক) | মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স (আনুমানিক) |
---|---|---|---|
1 |
| ~20966 | ~53688 |
2 |
| ~18385 | ~88653 |
3 |
| ~9860 | ~21028 |
4 |
| ~5793 | ~9837 |
5 |
| ~596 | ~1574 |
6 |
| ~266 | ~1318 |
7 |
| ~97 | ~283 |
8 |
| ~85 | ~100 |
9 |
| ~60 | ~178 |
10 |
| ~54 | ~140 |

(দ্রষ্টব্য: মানগুলি পূর্বে জিজ্ঞাসিত শীর্ষ ৫০টি মডেলের বিশদ তালিকা থেকে কোয়ান্টাইজেশন তথ্যের একটি সারাংশের উপর ভিত্তি করে আনুমানিক করা হয়েছে।)
প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় কোয়ান্টাইজেশন স্তর):
৪-বিট কোয়ান্টাইজেশন হলো প্রভাবশালী সমাধান:
Q4_K_M
,Q4_0
, এবংQ4_K_S
, এই তিনটি ৪-বিট কোয়ান্টাইজেশন স্তর, সম্পূর্ণভাবে চার্টের শীর্ষে রয়েছে। এটি স্পষ্টভাবে নির্দেশ করে যে কমিউনিটি মডেলের কর্মক্ষমতা, অনুমান গতি এবং রিসোর্স দখল (বিশেষত ভিআরএএম) এর মধ্যে সেরা ভারসাম্য অর্জনের জন্য পছন্দের সমাধান হিসাবে ৪-বিট কোয়ান্টাইজেশন ব্যাপকভাবে গ্রহণ করে।F16
(১৬-বিট ফ্লোটিং-পয়েন্ট) এখনও একটি গুরুত্বপূর্ণ স্থান ধরে রেখেছে: একটি অ-কোয়ান্টাইজড (বা শুধুমাত্র মৌলিকভাবে কোয়ান্টাইজড) সংস্করণ হিসাবে,F16
এর উচ্চ ডেপ্লয়মেন্ট দেখায় যে যথেষ্ট সংখ্যক ব্যবহারকারী সর্বোচ্চ মডেল বিশ্বস্ততা অনুসরণ করতে বা তাদের পর্যাপ্ত হার্ডওয়্যার সংস্থান থাকার কারণে এটি পছন্দ করে।Q8_0
(৮-বিট কোয়ান্টাইজেশন) একটি পরিপূরক হিসাবে: ৪-বিট এবংF16
এর মধ্যে একটি বিকল্প সরবরাহ করে।unknown
মানগুলির উপস্থিতি: নির্দেশ করে যে কিছু মডেল মেটাডেটায় কোয়ান্টাইজেশন স্তরের তথ্য অনুপস্থিত বা অ-মানক।
৬.৬ এআই কম্পিউটিং পাওয়ার বিতরণ (মডেল প্যারামিটার আকার অনুসারে): চীন বনাম মার্কিন যুক্তরাষ্ট্র (Distribution of AI Computing Power (by Model Parameter Size): China vs. USA)
প্রধান দেশগুলিতে বিভিন্ন স্কেলের মডেলগুলি কীভাবে স্থাপন করা হয় সে সম্পর্কে গভীরতর বোঝার জন্য, আমরা মার্কিন যুক্তরাষ্ট্র এবং চীনে ওলামা ইনস্ট্যান্সে স্থাপন করা মডেলগুলির প্যারামিটার আকারগুলিকে শ্রেণীবদ্ধ এবং গণনা করেছি। প্যারামিটার আকার প্রায়শই মডেল জটিলতা এবং সম্ভাব্য এআই কম্পিউটিং পাওয়ার চাহিদার একটি গুরুত্বপূর্ণ সূচক হিসাবে বিবেচিত হয়।
প্যারামিটার স্কেল শ্রেণিবিন্যাস মানদণ্ড:
ছোট: < ১ বিলিয়ন প্যারামিটার (< 1B)
মাঝারি: ১ বিলিয়ন থেকে < ১০ বিলিয়ন প্যারামিটার (1B to < 10B)
বড়: ১০ বিলিয়ন থেকে < ৫০ বিলিয়ন প্যারামিটার (10B to < 50B)
অতিরিক্ত বড়: >= ৫০ বিলিয়ন প্যারামিটার (>= 50B)
নীচের সারণীটি মার্কিন যুক্তরাষ্ট্র এবং চীনে বিভিন্ন প্যারামিটার স্কেলের মডেল স্থাপনকারী স্বতন্ত্র আইপি-র সংখ্যা দেখাচ্ছে:
দেশ | প্যারামিটার স্কেল বিভাগ | স্বতন্ত্র আইপি গণনা |
---|---|---|
চীন | ছোট (<1B) | 3313 |
চীন | মাঝারি (1B to <10B) | 4481 |
চীন | বড় (10B to <50B) | 1548 |
চীন | অতিরিক্ত বড় (>=50B) | 280 |
মার্কিন যুক্তরাষ্ট্র | ছোট (<1B) | 1368 |
মার্কিন যুক্তরাষ্ট্র | মাঝারি (1B to <10B) | 6495 |
মার্কিন যুক্তরাষ্ট্র | বড় (10B to <50B) | 1301 |
মার্কিন যুক্তরাষ্ট্র | অতিরিক্ত বড় (>=50B) | 58 |
--China-vs-USA.jpeg)
ডেটা অন্তর্দৃষ্টি এবং বিশ্লেষণ:
১. মাঝারি আকারের মডেলগুলি মূলস্রোত, তবে বিভিন্ন ফোকাস সহ: মার্কিন যুক্তরাষ্ট্র: মার্কিন যুক্তরাষ্ট্রে মাঝারি আকারের মডেলগুলির (1B-10B) ডেপ্লয়মেন্ট সম্পূর্ণ প্রভাবশালী (6495 স্বতন্ত্র আইপি)। চীন: চীনে মাঝারি আকারের মডেলগুলি (4481 স্বতন্ত্র আইপি) ও সর্বাধিক স্থাপন করা প্রকার, তবে চীনে ছোট মডেলগুলির (<1B) ডেপ্লয়মেন্ট (3313 স্বতন্ত্র আইপি) খুব উল্লেখযোগ্য। ২. ছোট মডেলগুলিতে উল্লেখযোগ্য পার্থক্য: চীনের ছোট মডেলগুলির বড় আকারের ডেপ্লয়মেন্ট এজ কম্পিউটিং, মোবাইল এআই অ্যাপ্লিকেশন এবং অনুরূপ পরিস্থিতির জন্য একটি পছন্দ প্রতিফলিত করতে পারে। ৩. বড় এবং অতিরিক্ত-বড় মডেলগুলির ডেপ্লয়মেন্ট: চীন বড় এবং অতিরিক্ত-বড় মডেলগুলি অনুসন্ধানে উচ্চতর কার্যকলাপ দেখায় (যদিও একটি ছোট বেস থেকে)। ৪. সামগ্রিক কম্পিউটিং পাওয়ার বিনিয়োগের উপর অনুমান: মাঝারি আকারের মডেলগুলিতে মার্কিন যুক্তরাষ্ট্রের ভিত্তি ব্যবহারিক এআই অ্যাপ্লিকেশনগুলির বিস্তার দেখায়। চীনের ছোট মডেলগুলিতে একটি সুবিধা রয়েছে এবং এটি সক্রিয়ভাবে বড় মডেলগুলি অনুসন্ধান করছে। ৫. বৈশ্বিক প্রবণতার জন্য প্রভাব: মাঝারি আকারের মডেলগুলি সম্ভবত বিশ্বব্যাপী জনপ্রিয়। বিভিন্ন অঞ্চলের তাদের বাস্তুতন্ত্র এবং সম্পদের অবস্থার উপর ভিত্তি করে বিভিন্ন মডেল গ্রহণ কৌশল থাকতে পারে।
চীন এবং মার্কিন যুক্তরাষ্ট্রে মডেল প্যারামিটার স্কেলগুলি ভাগ করে, আমরা দুটি দেশে ওলামা অ্যাপ্লিকেশনগুলির বিভিন্ন ফোকাস এবং উন্নয়ন সম্ভাবনা দেখতে পারি।
৭. নেটওয়ার্ক অন্তর্দৃষ্টি (Network Insights)
৭.১ পোর্ট ব্যবহার (Port Usage)
11434
(ডিফল্ট পোর্ট): ওলামা ইনস্ট্যান্সগুলির সিংহভাগ (৩০,৭২২ স্বতন্ত্র আইপি) ডিফল্ট পোর্ট11434
এ চলে।অন্যান্য সাধারণ পোর্ট:
80
(১,৬১৯ স্বতন্ত্র আইপি),8080
(১,৫৭১ স্বতন্ত্র আইপি),443
(১,৩৩৯ স্বতন্ত্র আইপি) ইত্যাদি পোর্টগুলিও ব্যবহৃত হয়, যা নির্দেশ করতে পারে যে কিছু ইনস্ট্যান্স একটি রিভার্স প্রক্সির পিছনে স্থাপন করা হয়েছে বা ব্যবহারকারীরা পোর্ট কাস্টমাইজ করেছেন।
৭.২ প্রোটোকল ব্যবহার (Protocol Usage)
HTTP: প্রায় ৬৫,৫০৬টি স্বতন্ত্র আইপি-র ইনস্ট্যান্স HTTP প্রোটোকলের মাধ্যমে পরিষেবা দিচ্ছে।
HTTPS: প্রায় ৪৩,৭৬৫টি স্বতন্ত্র আইপি-র ইনস্ট্যান্স HTTPS প্রোটোকলের মাধ্যমে পরিষেবা দিচ্ছে।
বেশিরভাগ ইনস্ট্যান্স এখনও এনক্রিপ্টবিহীন HTTP এর মাধ্যমে প্রকাশিত হয়, যা নির্দিষ্ট নিরাপত্তা ঝুঁকি তৈরি করতে পারে। (দয়া করে মনে রাখবেন: একটি আইপি HTTP এবং HTTPS উভয়ই সমর্থন করতে পারে, তাই এখানে আইপি গণনার যোগফল মোট স্বতন্ত্র আইপি-র সংখ্যা অতিক্রম করতে পারে)
৭.৩ প্রধান হোস্টিং প্রদানকারী (AS সংস্থা) (Main Hosting Providers (AS Organization))
ওলামা ইনস্ট্যান্স হোস্টিং ক্লাউড পরিষেবা প্রদানকারীদের মধ্যে অত্যন্ত কেন্দ্রীভূত।
র্যাঙ্ক | AS সংস্থা | স্বতন্ত্র আইপি গণনা | প্রধান সংশ্লিষ্ট প্রদানকারী |
---|---|---|---|
1 | AMAZON-02 | 53658 | AWS |
2 | AMAZON-AES | 5539 | AWS |
3 | Chinanet | 4964 | China Telecom |
4 | Hangzhou Alibaba Advertising Co.,Ltd. | 2647 | Alibaba Cloud |
5 | HENGTONG-IDC-LLC | 2391 | Hosting Provider |
6 | Shenzhen Tencent Computer Systems Company Limited | 1682 | Tencent Cloud |
7 | CHINA UNICOM China169 Backbone | 1606 | China Unicom |
8 | Hetzner Online GmbH | 972 | Hetzner |
9 | China Unicom Beijing Province Network | 746 | China Unicom (Beijing) |
10 | LEASEWEB-USA-LAX | 735 | Leaseweb |

এডব্লিউএস (AMAZON-02, AMAZON-AES) বৃহত্তম শেয়ার ধারণ করে, তারপরে প্রধান চীনা টেলিকম অপারেটর এবং ক্লাউড পরিষেবা প্রদানকারী (যেমন আলিবাবা ক্লাউড, টেনসেন্ট ক্লাউড)। হেটজনার এবং লিজওয়েবের মতো অন্যান্য হোস্টিং প্রদানকারীদেরও উল্লেখযোগ্য শেয়ার রয়েছে।
৮. নিরাপত্তা এবং অন্যান্য পর্যবেক্ষণ (Security and Other Observations)
সংস্করণ তথ্য: নিরাপত্তার কারণে, আমরা ওলামা সংস্করণগুলির পরিসংখ্যান তালিকাভুক্ত করিনি।
HTTP এক্সপোজার ঝুঁকি: যেমন আগে উল্লেখ করা হয়েছে, বিপুল সংখ্যক ওলামা ইনস্ট্যান্স টিএলএস এনক্রিপশন ছাড়াই HTTP এর মাধ্যমে প্রকাশিত হয়, যা যোগাযোগের বিষয়বস্তুকে (যেমন, মডেলগুলির সাথে মিথস্ক্রিয়া) আড়িপাতা বা বিকৃতির ঝুঁকিতে ফেলতে পারে। ব্যবহারকারীদের একটি রিভার্স প্রক্সি কনফিগার করতে এবং HTTPS সক্ষম করার পরামর্শ দেওয়া হচ্ছে।
এপিআই অ্যাক্সেসযোগ্যতা: এই প্রতিবেদনের ডেটা সেইসব ওলামা ইনস্ট্যান্সের উপর ভিত্তি করে যাদের
/api/tags
ইন্টারফেস সর্বজনীনভাবে অ্যাক্সেসযোগ্য। প্রকৃত ডেপ্লয়মেন্টের সংখ্যা বেশি হতে পারে, তবে কিছু ইনস্ট্যান্স ব্যক্তিগত নেটওয়ার্কে স্থাপন করা হতে পারে বা ফায়ারওয়াল দ্বারা বাহ্যিক অ্যাক্সেস সীমাবদ্ধ থাকতে পারে।
৯. উপসংহার এবং সংক্ষিপ্ত পর্যালোচনা (Conclusion and Brief Review)
এই প্রতিবেদনটি, বিশ্বব্যাপী ৯৯,৪১২টি সর্বজনীনভাবে অ্যাক্সেসযোগ্য ওলামা ইনস্ট্যান্সের (তাদের /api/tags
ইন্টারফেসের মাধ্যমে) ডেটা বিশ্লেষণ করে, নিম্নলিখিত প্রধান উপসংহার এবং পর্যবেক্ষণগুলি प्रस्तुत করে:
১. বিশ্বব্যাপী ডেপ্লয়মেন্টের সংক্ষিপ্তসার এবং ভৌগোলিক বিতরণ:
ওলামা, স্থানীয়ভাবে বড় মডেল চালানোর একটি সুবিধাজনক টুল হিসাবে, বিশ্বব্যাপী ব্যাপকভাবে স্থাপন করা হয়েছে। এই বিশ্লেষণে ৯৯,৪১২টি সর্বজনীনভাবে অ্যাক্সেসযোগ্য স্বতন্ত্র আইপি চিহ্নিত করা হয়েছে।
উচ্চ ভৌগোলিক ঘনত্ব: মার্কিন যুক্তরাষ্ট্র এবং চীন হলো সেই দুটি দেশ/অঞ্চল যেখানে ওলামা ডেপ্লয়মেন্ট সবচেয়ে বেশি কেন্দ্রীভূত, সম্মিলিতভাবে মোট অ্যাক্সেসযোগ্য ইনস্ট্যান্সের একটি উল্লেখযোগ্য অংশ দখল করে আছে (মার্কিন যুক্তরাষ্ট্র ২৯,১৯৫, চীন ১৬,৪৬৪)। জাপান, জার্মানি, যুক্তরাজ্য, ভারত এবং সিঙ্গাপুরের মতো দেশগুলিতেও উল্লেখযোগ্য ডেপ্লয়মেন্ট সংখ্যা রয়েছে।
শহরের হটস্পট: মার্কিন যুক্তরাষ্ট্রে, অ্যাশবার্ন, পোর্টল্যান্ড এবং কলম্বাসের মতো শহরগুলি ডেপ্লয়মেন্টে এগিয়ে আছে; চীনে, বেইজিং, হ্যাংঝৌ, সাংহাই এবং গুয়াংঝৌয়ের মতো প্রযুক্তিগতভাবে উন্নত শহরগুলি প্রধান ডেপ্লয়মেন্টের স্থান। এটি প্রায়শই প্রযুক্তি সংস্থা, ডেটা সেন্টার এবং ডেভেলপার কমিউনিটির ঘনত্বের সাথে সম্পর্কিত।
২. এআই মডেল ডেপ্লয়মেন্টের প্রবণতা:
জনপ্রিয় মডেল ট্যাগ:
llama3:latest
,deepseek-r1:latest
,mistral:latest
,qwen:latest
এর মতো সাধারণ সর্বশেষ ট্যাগগুলি সবচেয়ে জনপ্রিয়।llama3:8b-text-q4_K_S
এর মতো বিশেষভাবে অপ্টিমাইজ করা সংস্করণগুলিও তাদের ভাল ভারসাম্যের জন্য পছন্দ করা হয়।প্রভাবশালী মডেল পরিবার:
llama
পরিবার একটি সম্পূর্ণ ব্যবধানে এগিয়ে আছে, তারপরেqwen2
।nomic-bert
এবংbert
এর মতো এম্বেডিং মডেল পরিবারগুলির উচ্চ র্যাঙ্কিং উল্লেখযোগ্য, সম্ভবত ওলামার ডিফল্ট আচরণের সাথে সম্পর্কিত।প্যারামিটার আকারের পছন্দ: ৭বি-৮বি প্যারামিটারের মডেলগুলি বর্তমানে মূলস্রোত। মিলিয়ন-প্যারামিটার স্তরের লাইটওয়েট মডেল এবং ১০বি-এর উপরে বড় মডেলগুলিরও তাদের নিজ নিজ বাজার রয়েছে। একটি মার্কিন-চীন তুলনা দেখায় যে মার্কিন যুক্তরাষ্ট্র আরও মাঝারি আকারের মডেল স্থাপন করে, যেখানে চীন ছোট এবং অতিরিক্ত-বড় মডেলগুলি অনুসন্ধানে আরও সক্রিয়।
কোয়ান্টাইজেশন স্তরের পছন্দ: ৪-বিট কোয়ান্টাইজেশন (বিশেষত
Q4_K_M
এবংQ4_0
) হলো অপ্রতিরোধ্য পছন্দ।F16
, একটি উচ্চ-বিশ্বস্ততার বিকল্প হিসাবে, একটি গুরুত্বপূর্ণ অবস্থানে রয়েছে।মেটাডেটার জটিলতা: মডেল মেটাডেটার বিশ্লেষণ (যেমন, মডেল পরিবার ক্ষেত্র ব্যাখ্যা করা) কখনও কখনও এর রেকর্ড এবং মডেলের নাম বা সাধারণ বোঝার মধ্যে জটিলতা প্রকাশ করে, যা ওপেন-সোর্স ইকোসিস্টেমে মেটাডেটা ব্যবস্থাপনার বৈচিত্র্য তুলে ধরে।
৩. প্রযুক্তিগত পরিকাঠামো:
হোস্টিং পরিবেশ: বিপুল সংখ্যক ওলামা ইনস্ট্যান্স এডব্লিউএস, আলিবাবা ক্লাউড, টেনসেন্ট ক্লাউডের মতো প্রধান ক্লাউড পরিষেবা প্রদানকারীদের পাশাপাশি প্রধান জাতীয় টেলিকম অপারেটরদের নেটওয়ার্কে হোস্ট করা হয়।
সার্ভিস পোর্ট: ওলামার ডিফল্ট পোর্ট
11434
সর্বাধিক ব্যবহৃত হয়, তবে যথেষ্ট সংখ্যক ইনস্ট্যান্স স্ট্যান্ডার্ড ওয়েব পোর্টের মাধ্যমেও প্রকাশিত হয়।
৪. বস্তুনিষ্ঠ মূল্যায়ন:
ওলামার জনপ্রিয়তা: ডেটা স্পষ্টভাবে বিশ্বব্যাপী ডেভেলপার এবং এআই উত্সাহীদের মধ্যে ওলামার উচ্চ গ্রহণের হার দেখায়।
ওপেন-সোর্স ইকোসিস্টেমের প্রাণবন্ততা: জনপ্রিয় মডেলগুলির বৈচিত্র্য এবং বিভিন্ন প্যারামিটার এবং কোয়ান্টাইজেশন সংস্করণগুলির ব্যাপক ব্যবহার ওপেন-সোর্স এআই মডেল ইকোসিস্টেমের ক্রমবর্ধমান উন্নয়নকে প্রতিফলিত করে।
ব্যবহারকারীর পছন্দের ভারসাম্য: মডেল নির্বাচন করার সময়, ব্যবহারকারীরা মডেলের ক্ষমতা, অপারেশনাল দক্ষতা এবং হার্ডওয়্যার খরচের মধ্যে একটি ভারসাম্য খোঁজার প্রবণতা দেখায়।
নিরাপত্তা এবং উন্মুক্ততা: বিপুল সংখ্যক ইনস্ট্যান্স তাদের মডেল তালিকায় সর্বজনীন অ্যাক্সেসের অনুমতি দেয়, যা কমিউনিটির জন্য সুবিধাজনক হলেও নিরাপত্তা ঝুঁকিও তৈরি করতে পারে।
৫. ভবিষ্যতের রূপরেখা:
আরও দক্ষ, ছোট মডেলের উত্থান এবং কোয়ান্টাইজেশন প্রযুক্তিতে আরও অগ্রগতির সাথে, ওলামার জন্য ডেপ্লয়মেন্ট বাধা ক্রমাগত হ্রাস পাবে বলে আশা করা হচ্ছে।
মডেল মেটাডেটার মানককরণ এবং কমিউনিটি-শেয়ার্ড মডেলগুলি ইকোসিস্টেমের স্বচ্ছতা এবং ব্যবহারযোগ্যতা বাড়ানোর জন্য অত্যন্ত গুরুত্বপূর্ণ।
সংক্ষেপে, ওলামা অত্যাধুনিক বৃহৎ ভাষার মডেলগুলিকে বিস্তৃত ডেভেলপার, গবেষক এবং এমনকি সাধারণ ব্যবহারকারীদের সাথে সংযুক্ত করার একটি গুরুত্বপূর্ণ সেতু হয়ে উঠছে। এই ডেটা বিশ্লেষণ তার বর্তমান বিশ্বব্যাপী ডেপ্লয়মেন্ট স্থিতি এবং ব্যবহারকারীর পছন্দগুলি বোঝার জন্য মূল্যবান অন্তর্দৃষ্টি সরবরাহ করে।
মন্তব্য
comments.comments (0)
Please login first
Sign in