Tenthe ai directory logo
মার্কিন-চীন এআই প্রতিযোগিতা নিয়ে একটি নতুন দৃষ্টিকোণ: ২০২৫ ওলামা ডেপ্লয়মেন্ট তুলনা এবং গ্লোবাল এআই মডেল ট্রেন্ডের অন্তর্দৃষ্টি (A New Perspective on the US-China AI Race: 2025 Ollama Deployment Comparison and Global AI Model Trend Insights)

মার্কিন-চীন এআই প্রতিযোগিতা নিয়ে একটি নতুন দৃষ্টিকোণ: ২০২৫ ওলামা ডেপ্লয়মেন্ট তুলনা এবং গ্লোবাল এআই মডেল ট্রেন্ডের অন্তর্দৃষ্টি (A New Perspective on the US-China AI Race: 2025 Ollama Deployment Comparison and Global AI Model Trend Insights)

Ryan@ryan
0 দর্শন0 মন্তব্য

ওলামা একটি জনপ্রিয় ওপেন-সোর্স টুল যা স্থানীয়ভাবে বৃহৎ ভাষার মডেল (LLMs) চালানো, তৈরি এবং শেয়ার করার প্রক্রিয়াটিকে সহজ করার জন্য ডিজাইন করা হয়েছে। এটি মডেল ওয়েট, কনফিগারেশন এবং ডেটাকে একটি প্যাকেজে বান্ডিল করে যা একটি মডেলফাইল দ্বারা সংজ্ঞায়িত করা হয়, এবং এই মডেলগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য একটি এপিআই সরবরাহ করে। এটি ডেভেলপার এবং গবেষকদের ব্যক্তিগত কম্পিউটার বা সার্ভারে বিভিন্ন উন্নত এআই মডেল সহজে স্থাপন এবং পরীক্ষা করার সুযোগ করে দেয়।

১. ভূমিকা (Introduction)

ওলামা একটি জনপ্রিয় ওপেন-সোর্স টুল যা স্থানীয়ভাবে বৃহৎ ভাষার মডেল (LLMs) চালানো, তৈরি এবং শেয়ার করার প্রক্রিয়াটিকে সহজ করার জন্য ডিজাইন করা হয়েছে। এটি মডেল ওয়েট, কনফিগারেশন এবং ডেটাকে একটি প্যাকেজে বান্ডিল করে যা একটি মডেলফাইল দ্বারা সংজ্ঞায়িত করা হয়, এবং এই মডেলগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য একটি এপিআই সরবরাহ করে। এটি ডেভেলপার এবং গবেষকদের ব্যক্তিগত কম্পিউটার বা সার্ভারে বিভিন্ন উন্নত এআই মডেল সহজে স্থাপন এবং পরীক্ষা করার সুযোগ করে দেয়।

এই প্রতিবেদনের লক্ষ্য হলো বিশ্বব্যাপী স্থাপন করা ১,৭৪,৫৯০টি ওলামা ইনস্ট্যান্স থেকে ডেটা বিশ্লেষণ করে ডেপ্লয়মেন্ট প্রবণতা, মডেল পছন্দ, ভৌগোলিক বিতরণ এবং নেটওয়ার্ক বৈশিষ্ট্যগুলি প্রকাশ করা।

দ্রষ্টব্য: অধ্যায় ৫ এবং অধ্যায় ৭-এর ডেটা পরিসংখ্যান সমস্ত ১,৭৪,৫৯০টি ইনস্ট্যান্স থেকে সংগ্রহ করা হয়েছে। অধ্যায় ৬-এর ডেটা অ্যাক্সেসযোগ্য ইনস্ট্যান্স থেকে সংগ্রহ করা হয়েছে। নিরাপত্তার কারণে, আমরা ওলামা সংস্করণগুলির পরিসংখ্যান তালিকাভুক্ত করিনি।

  • ডেটা সংগ্রহ截至: ২৪ এপ্রিল, ২০২৫।

  • প্রতিবেদনের উৎস: Tenthe AI https://tenthe.com

  • লেখক: রায়ান

২. নির্বাহী সারসংক্ষেপ (Executive Summary)

এই প্রতিবেদনটি বিশ্বব্যাপী সর্বজনীনভাবে উপলব্ধ ওলামা ইনস্ট্যান্সগুলির স্ক্যান ডেটা এবং এপিআই প্রোবিং বিশ্লেষণের উপর ভিত্তি করে তৈরি। মূল অনুসন্ধানগুলির মধ্যে রয়েছে:

  • বিশ্বব্যাপী, ফোফা (Fofa) দ্বারা প্রাথমিকভাবে চিহ্নিত প্রায় ১,৭৪,৫৯০টি রেকর্ডের মধ্যে (৯৯,৪১২ স্বতন্ত্র আইপি), ৪১,০২১টি ওলামা ইনস্ট্যান্সের অ্যাক্সেসযোগ্য এপিআই সফলভাবে প্রোব করা হয়েছে, যা ২৪,০৩৮টি স্বতন্ত্র আইপি ঠিকানায় বিতরণ করা হয়েছে (অ্যাক্সেসযোগ্যতার হার প্রায় ২৪.১৮%)।

  • ভৌগোলিকভাবে, মার্কিন যুক্তরাষ্ট্র এবং চীন হলো সেই দেশ যেখানে ওলামা ডেপ্লয়মেন্টের সংখ্যা সর্বাধিক। ক্লাউড পরিষেবা প্রদানকারী, বিশেষত এডব্লিউএস (AWS), আলিবাবা ক্লাউড এবং টেনসেন্ট ক্লাউড, ওলামা ইনস্ট্যান্সগুলির প্রাথমিক হোস্ট।

  • মডেল ডেপ্লয়মেন্টে বৈচিত্র্য দেখা যায়, যেখানে llama3, deepseek-r1, mistral, এবং qwen সিরিজের মডেলগুলি ব্যাপকভাবে জনপ্রিয়। এদের মধ্যে, llama3:latest এবং deepseek-r1:latest হলো দুটি সর্বাধিক ব্যাপকভাবে স্থাপন করা মডেল ট্যাগ।

  • ৭বি-৮বি প্যারামিটারের মডেলগুলি ব্যবহারকারীদের শীর্ষ পছন্দ, যেখানে Q4_K_M এবং Q4_0 এর মতো ৪-বিট কোয়ান্টাইজড মডেলগুলি তাদের পারফরম্যান্স এবং রিসোর্স খরচের মধ্যে ভালো ভারসাম্যের জন্য ব্যাপকভাবে গৃহীত হয়েছে।

  • ডিফল্ট পোর্ট 11434 সর্বাধিক ব্যবহৃত হয়, এবং বেশিরভাগ ইনস্ট্যান্স HTTP প্রোটোকলের মাধ্যমে পরিষেবাগুলি প্রকাশ করে।

৩. ডেটা উৎস এবং পদ্ধতি (Data Sources and Methodology)

এই প্রতিবেদনের জন্য ডেটা মূলত দুটি পর্যায় থেকে এসেছে: ১. প্রাথমিক স্ক্যান: নেটওয়ার্ক স্পেস সার্চ ইঞ্জিন যেমন ফোফা (Fofa) ব্যবহার করে, app="Ollama" && is_domain=false শর্তের সাথে, বিশ্বব্যাপী স্থাপন করা সম্ভাব্য ওলামা ইনস্ট্যান্সগুলি প্রাথমিকভাবে সনাক্ত করা। এই পর্যায়ে ১,৭৪,৫৯০টি রেকর্ড পাওয়া গেছে, যেখানে ডিডুপ্লিকেশনের পরে ৯৯,৪১২টি স্বতন্ত্র আইপি জড়িত। ২. এপিআই যাচাইকরণ এবং ডেটা সমৃদ্ধকরণ: প্রাথমিকভাবে স্ক্যান করা আইপি ঠিকানাগুলির জন্য ip:port/api/tags এপিআই এন্ডপয়েন্ট প্রোব করে ওলামা পরিষেবাগুলির অ্যাক্সেসযোগ্যতা নিশ্চিত করা এবং স্থাপন করা নির্দিষ্ট এআই মডেলগুলি সম্পর্কে তথ্য প্রাপ্ত করা। এই পর্যায়ে ৪১,০২১টি সফলভাবে প্রতিক্রিয়াশীল ওলামা ইনস্ট্যান্স নিশ্চিত করা হয়েছে ( ২৪,০৩৮টি স্বতন্ত্র আইপি থেকে, ollama টেবিলে ডেটা সংরক্ষিত)। ৩. চূড়ান্ত ডেটা ollama টেবিলে সংরক্ষণ করা হয়।

এই প্রতিবেদনের বিশ্লেষণ মূলত ollama টেবিলের ডেটার উপর ভিত্তি করে, যেখানে সফলভাবে প্রোব করা এপিআই এবং তাদের বিস্তারিত তথ্য, যেমন আইপি, পোর্ট, ভৌগোলিক অবস্থান এবং JSON প্রতিক্রিয়া (মডেল তালিকা সম্বলিত) ইত্যাদি রেকর্ড রয়েছে।

৪. সামগ্রিক ডেপ্লয়মেন্ট পরিসংখ্যান (Overall Deployment Statistics)

  • ফোফা স্ক্যান থেকে প্রাথমিক রেকর্ডের সংখ্যা: ১,৭৪,৫৯০

  • ফোফা প্রাথমিক স্ক্যান থেকে স্বতন্ত্র আইপি-র সংখ্যা: ৯৯,৪১২

  • /api/tags সফলভাবে অ্যাক্সেস করা ওলামা ইনস্ট্যান্সের সংখ্যা: ৪১,০২১ (ollama টেবিলে status = 'success' থাকা রেকর্ড থেকে)

  • সংশ্লিষ্ট স্বতন্ত্র আইপি ঠিকানার সংখ্যা: ২৪,০৩৮ (ollama টেবিলে status = 'success' থাকা রেকর্ড থেকে)

  • প্রাথমিকভাবে চিহ্নিত আইপি-র সাথে অ্যাক্সেসযোগ্য আইপি-র অনুপাত: (২৪০৩৮ / ৯৯৪১২) * ১০০% ≈ ২৪.১৮%

এটি নির্দেশ করে যে ফোফা দ্বারা চিহ্নিত সমস্ত ওলামা ইনস্ট্যান্সগুলির মধ্যে প্রায় এক চতুর্থাংশের /api/tags ইন্টারফেস সর্বজনীনভাবে অ্যাক্সেসযোগ্য, যা আমাদের তাদের স্থাপন করা মডেলগুলি সম্পর্কে তথ্য পুনরুদ্ধার করতে দেয়।

৫. ভৌগোলিক বিতরণ বিশ্লেষণ (Geographical Distribution Analysis)

৫.১ শীর্ষ ২০টি ডেপ্লয়মেন্ট দেশ/অঞ্চল (Top 20 Deployment Countries/Regions)

নীচের সারণীটি ওলামা ইনস্ট্যান্স সহ স্বতন্ত্র আইপি-র সংখ্যা অনুসারে শীর্ষ ২০টি দেশ/অঞ্চল দেখাচ্ছে।

র‍্যাঙ্ক

দেশ/অঞ্চল

স্বতন্ত্র আইপি গণনা

1

মার্কিন যুক্তরাষ্ট্র

29195

2

চীন

16464

3

জাপান

5849

4

জার্মানি

5438

5

যুক্তরাজ্য

4014

6

ভারত

3939

7

সিঙ্গাপুর

3914

8

দক্ষিণ কোরিয়া

3773

9

আয়ারল্যান্ড

3636

10

ফ্রান্স

3599

11

অস্ট্রেলিয়া

3558

12

ব্রাজিল

2909

13

কানাডা

2763

14

দক্ষিণ আফ্রিকা

2742

15

সুইডেন

2113

16

হংকং এসএআর, চীন

1277

17

ইসরায়েল

675

18

তাইওয়ান, চীন

513

19

রাশিয়া

475

20

ফিনল্যান্ড

308

Ollama Top 20 Deployment Countries/Regions

৫.২ শীর্ষ ২০টি গ্লোবাল সিটি ডেপ্লয়মেন্ট (Top 20 Global City Deployments)

নীচের সারণীটি ওলামা ইনস্ট্যান্স সহ স্বতন্ত্র আইপি-র সংখ্যা অনুসারে বিশ্বব্যাপী শীর্ষ ২০টি শহর দেখাচ্ছে।

র‍্যাঙ্ক

শহর

দেশ/অঞ্চল

স্বতন্ত্র আইপি গণনা

1

অ্যাশবার্ন

মার্কিন যুক্তরাষ্ট্র

5808

2

পোর্টল্যান্ড

মার্কিন যুক্তরাষ্ট্র

5130

3

সিঙ্গাপুর

সিঙ্গাপুর

3914

4

ফ্রাঙ্কফুর্ট অ্যাম মেইন

জার্মানি

3908

5

বেইজিং

চীন

3906

6

লন্ডন

যুক্তরাজ্য

3685

7

কলম্বাস

মার্কিন যুক্তরাষ্ট্র

3672

8

মুম্বাই

ভারত

3637

9

ডাবলিন

আয়ারল্যান্ড

3631

10

টোকিও

জাপান

3620

11

সিডনি

অস্ট্রেলিয়া

3487

12

প্যারিস

ফ্রান্স

3175

13

সান হোসে

মার্কিন যুক্তরাষ্ট্র

2815

14

সাও পাওলো

ব্রাজিল

2753

15

কেপ টাউন

দক্ষিণ আফ্রিকা

2692

16

মন্ট্রিল

কানাডা

2535

17

সিয়াটল

মার্কিন যুক্তরাষ্ট্র

2534

18

হ্যাংঝৌ

চীন

2447

19

সিউল

দক্ষিণ কোরিয়া

2327

20

ওসাকা

জাপান

2184

৫.৩ শীর্ষ ১০টি মার্কিন শহর বিতরণ (Top 10 US City Distribution)

র‍্যাঙ্ক

শহর

স্বতন্ত্র আইপি গণনা

1

অ্যাশবার্ন

5808

2

পোর্টল্যান্ড

5130

3

কলম্বাস

3672

4

সান হোসে

2815

5

সিয়াটল

2534

6

ওয়েস্টলেক ভিলেজ

1714

7

বোর্ডম্যান

855

8

ফ্লোরেন্স

776

9

সান ফ্রান্সিসকো

753

10

বোল্ডার

642

Ollama Top 10 US City Distribution

৫.৪ শীর্ষ ১০টি চীনের মূল ভূখণ্ড শহর বিতরণ (Top 10 Mainland China City Distribution)

হংকং এবং তাইওয়ানের ডেপ্লয়মেন্টগুলি শীর্ষ ১০টি শহরের সারণীতে প্রতিফলিত হয়নি কারণ সেগুলি ইতিমধ্যে দেশ/অঞ্চল পরিসংখ্যানে অন্তর্ভুক্ত রয়েছে।

র‍্যাঙ্ক

শহর

দেশ (country_name)

স্বতন্ত্র আইপি গণনা

1

বেইজিং

চীন

3906

2

হ্যাংঝৌ

চীন

2447

3

সাংহাই

চীন

1335

4

গুয়াংঝৌ

চীন

1296

5

শেনঝেন

চীন

768

6

চেংদু

চীন

469

7

নানজিং

চীন

329

8

চংকিং

চীন

259

9

সুঝৌ

চীন

257

10

উহান

চীন

249

Ollama Top 20 Global City Deployments

৫.৫ মার্কিন-চীন শীর্ষ ১০টি শহর ডেপ্লয়মেন্ট তুলনা (US-China Top 10 City Deployment Comparison)

মার্কিন যুক্তরাষ্ট্র এবং চীনে শহর পর্যায়ে ওলামা ডেপ্লয়মেন্টগুলি আরও স্বজ্ঞাতভাবে তুলনা করার জন্য, নীচের সারণীটি উভয় দেশের শীর্ষ ১০টি শহরের জন্য স্বতন্ত্র আইপি ডেপ্লয়মেন্ট গণনার তুলনা করে:

র‍্যাঙ্ক

মার্কিন শহর (শীর্ষ ১০)

মার্কিন স্বতন্ত্র আইপি গণনা

চীনা শহর (শীর্ষ ১০)

চীনা স্বতন্ত্র আইপি গণনা

1

অ্যাশবার্ন

5808

বেইজিং

3906

2

পোর্টল্যান্ড

5130

হ্যাংঝৌ

2447

3

কলম্বাস

3672

সাংহাই

1335

4

সান হোসে

2815

গুয়াংঝৌ

1296

5

সিয়াটল

2534

শেনঝেন

768

6

ওয়েস্টলেক ভিলেজ

1714

চেংদু

469

7

বোর্ডম্যান

855

নানজিং

329

8

ফ্লোরেন্স

776

চংকিং

259

9

সান ফ্রান্সিসকো

753

সুঝৌ

257

10

বোল্ডার

642

উহান

249

Ollama US-China Top 10 City Deployment Comparison

সংক্ষিপ্ত মন্তব্য:

  • শীর্ষস্থানীয় শহরের পরিমাণ: মার্কিন যুক্তরাষ্ট্রের শীর্ষ ৩টি শহরে (অ্যাশবার্ন, পোর্টল্যান্ড, কলম্বাস) প্রতিটিতে ৩,০০০-এর বেশি স্বতন্ত্র আইপি-তে ওলামা ডেপ্লয়মেন্ট রয়েছে। চীনের শীর্ষ শহর (বেইজিং) এ ৩,০০০-এর বেশি ডেপ্লয়মেন্ট এবং এর দ্বিতীয় শহর (হ্যাংঝৌ) তে ২,০০০-এর বেশি ডেপ্লয়মেন্ট রয়েছে।

  • প্রযুক্তি এবং অর্থনৈতিক কেন্দ্র: উভয় দেশের তালিকাভুক্ত অনেক শহরই সুপরিচিত প্রযুক্তি উদ্ভাবন কেন্দ্র বা গুরুত্বপূর্ণ অর্থনৈতিক অঞ্চল।

  • ডেটা সেন্টার অঞ্চল: অ্যাশবার্নের মতো মার্কিন শহরগুলির অন্তর্ভুক্তি এটাও প্রতিফলিত করে যে ওলামা ইনস্ট্যান্সগুলি মূলত ক্লাউড সার্ভার এবং ডেটা সেন্টারগুলির মধ্যে স্থাপন করা হতে পারে।

  • বিতরণ পার্থক্য: সামগ্রিকভাবে, মার্কিন শীর্ষ ১০টি শহরের মোট আইপি সংখ্যা চীনের শীর্ষ ১০টি শহরের তুলনায় উল্লেখযোগ্যভাবে বেশি। তবে, উভয় দেশেই এমন একটি প্যাটার্ন দেখা যায় যেখানে কয়েকটি মূল শহর ওলামা ডেপ্লয়মেন্টের সিংহভাগ দখল করে আছে।

এই শহর-স্তরের তুলনা আরও প্রকাশ করে যে ওলামার প্রচার এবং প্রয়োগ, একটি ডেভেলপার টুল হিসাবে, আঞ্চলিক প্রযুক্তিগত বাস্তুতন্ত্র এবং শিল্প উন্নয়নের সাথে ঘনিষ্ঠভাবে জড়িত।

৬. মডেল বিশ্লেষণ (Model Analysis)

৬.১ এআই মডেল, প্যারামিটার এবং কোয়ান্টাইজেশনের সংক্ষিপ্ত বিবরণ (Brief Overview of AI Models, Parameters, and Quantization)

ওলামা বিভিন্ন ধরনের ওপেন-সোর্স বৃহৎ ভাষার মডেল সমর্থন করে। এই মডেলগুলি সাধারণত নিম্নলিখিত বৈশিষ্ট্য দ্বারা পৃথক করা হয়:

৬.১.১ সাধারণ মডেল পরিবার (Common Model Families)

বর্তমান ওপেন-সোর্স কমিউনিটিতে চমৎকার এলএলএম পরিবারের একটি উত্থান দেখা গেছে, যার প্রতিটির নিজস্ব বৈশিষ্ট্য রয়েছে:

  • লামা সিরিজ (মেটা এআই): যেমন লামা ২, লামা ৩, কোড লামা। এর শক্তিশালী সাধারণ ক্ষমতা এবং ব্যাপক কমিউনিটি সমর্থনের জন্য পরিচিত, যার ফলে অসংখ্য ফাইন-টিউনড সংস্করণ তৈরি হয়েছে। আমাদের ডেটাতে দেখা llama3.1, hermes3 এর মতো মডেলগুলি প্রায়শই লামা আর্কিটেকচারের উপর ভিত্তি করে তৈরি।

  • মিস্ট্রাল সিরিজ (মিস্ট্রাল এআই): যেমন মিস্ট্রাল ৭বি, মিক্সট্রাল ৮x৭বি। দক্ষতা এবং উচ্চ কার্যকারিতার জন্য মনোযোগ আকর্ষণ করছে, বিশেষত এর MoE (মিক্সচার অফ এক্সপার্টস) মডেলগুলি।

  • জেমা সিরিজ (গুগল): যেমন জেমা ২বি, জেমা ৭বি। গুগল দ্বারা প্রকাশিত ওপেন-ওয়েট মডেল, তাদের আরও শক্তিশালী জেমিনি মডেল থেকে প্রাপ্ত প্রযুক্তি সহ।

  • ফাই সিরিজ (মাইক্রোসফট): যেমন ফাই-২, ফাই-৩। ছোট আকারের অথচ সক্ষম মডেলগুলিতে ফোকাস করে, "এসএলএম (ছোট ভাষার মডেল)" এর উপর জোর দেয়।

  • ডিপসিক সিরিজ (ডিপসিক এআই): যেমন ডিপসিক কোডার, ডিপসিক এলএলএম। চীনা এআই মডেল যা কোডিং এবং সাধারণ কাজগুলিতে পারদর্শী।

  • কোয়েন সিরিজ (আলিবাবা টংই কিয়ানওয়েন): যেমন কোয়েন১.৫। আলিবাবা ডামো একাডেমি কর্তৃক চালু করা মডেলগুলির একটি সিরিজ, একাধিক ভাষা এবং কাজ সমর্থন করে।

  • আরও অনেক চমৎকার মডেল রয়েছে, যেমন यी (01.AI), কমান্ড আর (Cohere) ইত্যাদি।

ওলামা, তার Modelfile পদ্ধতির মাধ্যমে, ব্যবহারকারীদের এই বেস মডেলগুলি বা তাদের ফাইন-টিউনড সংস্করণগুলি সহজে ব্যবহার করতে দেয়। মডেলের নামগুলি প্রায়শই পরিবার:আকার-ভেরিয়েন্ট-কোয়ান্টাইজেশন ফরম্যাট অনুসরণ করে, উদাহরণস্বরূপ, llama3:8b-instruct-q4_K_M

৬.১.২ মডেল প্যারামিটার (প্যারামিটারের আকার) (Model Parameters (Parameter Size))

মডেল প্যারামিটারের সংখ্যা (সাধারণত বি - বিলিয়ন; বা এম - মিলিয়ন) একটি মডেলের স্কেল এবং সম্ভাব্য ক্ষমতার একটি গুরুত্বপূর্ণ সূচক। সাধারণ প্যারামিটারের আকারগুলির মধ্যে রয়েছে:

  • ছোট মডেল: < ৭বি (যেমন, ১.৫বি, ২বি, ৩বি)। সাধারণত কম রিসোর্স খরচে দ্রুত চলে, নির্দিষ্ট কাজ বা রিসোর্স-সীমাবদ্ধ পরিবেশের জন্য উপযুক্ত।

  • মাঝারি মডেল: ৭বি, ৮বি, ১৩বি। ক্ষমতা এবং রিসোর্স খরচের মধ্যে একটি ভাল ভারসাম্য অর্জন করে, বর্তমানে কমিউনিটিতে সবচেয়ে জনপ্রিয় আকারগুলির মধ্যে একটি।

  • বড় মডেল: ৩০বি, ৩৩বি, ৪০বি, ৭০বি+। সাধারণত আরও সক্ষম তবে আরও বেশি গণনামূলক সম্পদ (র‌্যাম, ভিআরএএম) এবং দীর্ঘ অনুমান সময় প্রয়োজন।

আমাদের ডেটাতে parameter_size ক্ষেত্র (যেমন, "8.0B", "7B", "134.52M") এটি নির্দেশ করে।

৬.১.৩ কোয়ান্টাইজেশন সংস্করণ (কোয়ান্টাইজেশন স্তর) (Quantization Versions (Quantization Level))

কোয়ান্টাইজেশন হলো মডেলের ওজনগুলির সংখ্যাসূচক নির্ভুলতা হ্রাস করে (যেমন, ১৬-বিট ফ্লোটিং-পয়েন্ট FP16 থেকে ৪-বিট পূর্ণসংখ্যা INT4) মডেলের আকার হ্রাস এবং অনুমান ত্বরান্বিত করার একটি কৌশল।

  • সাধারণ কোয়ান্টাইজেশন স্তর: ওলামা এবং জিজেইউএফ (GGUF) ফরম্যাট (লামা.সিপিপি দ্বারা ব্যবহৃত) বিভিন্ন কোয়ান্টাইজেশন কৌশল সমর্থন করে, যেমন Q2_K, Q3_K_S, Q3_K_M, Q3_K_L, Q4_0, Q4_K_M, Q5_K_M, Q6_K, Q8_0 ইত্যাদি।

    • সংখ্যা (যেমন, ২, ৩, ৪, ৫, ৬, ৮) মোটামুটিভাবে বিটের সংখ্যা নির্দেশ করে।

    • K সিরিজের কোয়ান্টাইজেশন (যেমন, Q4_K_M) হলো লামা.সিপিপি-তে প্রবর্তিত উন্নত কোয়ান্টাইজেশন পদ্ধতি, যা সাধারণত একই বিট সংখ্যায় উন্নত কর্মক্ষমতা অর্জন করে।

    • _S, _M, _L সাধারণত K-কোয়ান্টের বিভিন্ন রূপ নির্দেশ করে, যা মডেলের বিভিন্ন অংশকে প্রভাবিত করে।

    • F16 (FP16) ১৬-বিট ফ্লোটিং-পয়েন্ট প্রতিনিধিত্ব করে, প্রায়শই অ-কোয়ান্টাইজড বা একটি বেস কোয়ান্টাইজেশন সংস্করণ হিসাবে বিবেচিত হয়। F32 (FP32) হলো পূর্ণ নির্ভুলতা।

  • ট্রেড-অফ: উচ্চতর কোয়ান্টাইজেশন (কম বিট সংখ্যা) ছোট, দ্রুত মডেলের দিকে পরিচালিত করে, তবে সাধারণত কিছু কর্মক্ষমতা হ্রাস পায় (মডেল খারাপ পারফর্ম করে)। ব্যবহারকারীদের তাদের হার্ডওয়্যার এবং মডেলের গুণমানের প্রয়োজনীয়তার উপর ভিত্তি করে পছন্দ করতে হবে।

আমাদের ডেটাতে quantization_level ক্ষেত্র (যেমন, "Q4_K_M", "F16") এটি নির্দেশ করে।

৬.২ শীর্ষ জনপ্রিয় মডেলের নাম (Top Popular Model Names)

নীচের সারণীটি স্বতন্ত্র আইপি ডেপ্লয়মেন্টের সংখ্যা অনুসারে শীর্ষ ১০টি মডেল ট্যাগ দেখাচ্ছে, যার মধ্যে তাদের পরিবার, প্যারামিটারের আকার এবং কোয়ান্টাইজেশন স্তরের তথ্য অন্তর্ভুক্ত রয়েছে।

র‍্যাঙ্ক

মডেলের নাম (model_name)

স্বতন্ত্র আইপি ডেপ্লয়মেন্ট

মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স

1

llama3:latest

12659

24628

2

deepseek-r1:latest

12572

24578

3

mistral:latest

11163

22638

4

qwen:latest

9868

21007

5

llama3:8b-text-q4_K_S

9845

20980

6

smollm2:135m

4058

5016

7

llama2:latest

3124

3928

8

hermes3:8b

2856

3372

9

llama3.1:8b

2714

3321

10

qwen2.5:1.5b

2668

3391

Ollama Top Popular Model Names

(দ্রষ্টব্য: স্বতন্ত্র আইপি ডেপ্লয়মেন্ট বলতে সেইসব স্বতন্ত্র আইপি ঠিকানার সংখ্যা বোঝায় যেখানে এই মডেল ট্যাগের অন্তত একটি ইনস্ট্যান্স স্থাপন করা হয়েছে। মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স বলতে সমস্ত আইপি জুড়ে models তালিকায় এই মডেল ট্যাগটি যতবার উপস্থিত হয়েছে তার মোট সংখ্যা বোঝায়। একটি আইপি বিভিন্ন উপায়ে বা রেকর্ডের মাধ্যমে একই মডেল ট্যাগের দিকে নির্দেশ করতে পারে, অথবা একটি আইপি একই বেস মডেলের বিভিন্ন ট্যাগের একাধিক ইনস্ট্যান্স চালাতে পারে।)

প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় মডেলের নাম):

  • :latest ট্যাগযুক্ত মডেলগুলি খুব সাধারণ, যেমন llama3:latest, deepseek-r1:latest, mistral:latest, qwen:latest। এটি নির্দেশ করে যে অনেক ব্যবহারকারী সরাসরি মডেলগুলির সর্বশেষ সংস্করণ পুল করতে পছন্দ করেন।

  • লামা সিরিজের মডেলগুলি (যেমন, llama3:latest, llama3:8b-text-q4_K_S, llama2:latest, llama3.1:8b) একাধিক স্থান দখল করে আছে, যা তাদের শক্তিশালী জনপ্রিয়তা দেখায়।

  • চীনা এআই মডেল যেমন deepseek-r1:latest (ডিপসিক সিরিজ) এবং qwen:latest (টংই কিয়ানওয়েন সিরিজ) ও চিত্তাকর্ষক পারফরম্যান্স দেখিয়েছে, উচ্চ র‍্যাঙ্কিংয়ে রয়েছে।

  • llama3:8b-text-q4_K_S এর মতো নির্দিষ্ট কোয়ান্টাইজড সংস্করণগুলিও শীর্ষ দশে স্থান পেয়েছে, যা নির্দিষ্ট কর্মক্ষমতা/রিসোর্স খরচের ভারসাম্যের প্রতি ব্যবহারকারীর পছন্দ নির্দেশ করে।

  • smollm2:135m এবং qwen2.5:1.5b এর মতো ছোট মডেলগুলিরও যথেষ্ট সংখ্যক ডেপ্লয়মেন্ট রয়েছে, যা লাইটওয়েট মডেলের চাহিদা পূরণ করে।

৬.৩ শীর্ষ মডেল পরিবার (Top Model Families)

মডেল পরিবার (details.family ক্ষেত্র) মডেলের বেস আর্কিটেকচার বা প্রাথমিক প্রযুক্তিগত বংশ নির্দেশ করে। নীচে আমাদের ডেটা বিশ্লেষণের ভিত্তিতে উচ্চ সংখ্যক ডেপ্লয়মেন্ট সহ মডেল পরিবারগুলি রয়েছে:

র‍্যাঙ্ক

মডেল পরিবার (family)

স্বতন্ত্র আইপি ডেপ্লয়মেন্ট (আনুমানিক)

মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স (আনুমানিক)

1

llama

~20250

~103480

2

qwen2

~17881

~61452

3

nomic-bert

~1479

~1714

4

gemma3

~1363

~2493

5

bert

~1228

~2217

6

mllama

~943

~1455

7

gemma

~596

~750

8

deepseek2

~484

~761

9

phi3

~368

~732

10

gemma2

~244

~680

Ollama Top Model Families

(দ্রষ্টব্য: এখানে নির্দিষ্ট মানগুলি আনুমানিক এবং পূর্বে জিজ্ঞাসিত শীর্ষ ৫০টি মডেলের বিশদ তালিকার উপর ভিত্তি করে সংক্ষিপ্ত করা হয়েছে এবং সুনির্দিষ্ট বৈশ্বিক পরিসংখ্যান থেকে সামান্য ভিন্ন হতে পারে, তবে প্রবণতাটি প্রতিনিধিত্বমূলক।)

প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় মডেল পরিবার):

  • llama পরিবার একটি সম্পূর্ণ প্রভাবশালী অবস্থানে রয়েছে, যা লামা সিরিজের মডেলগুলির অনেক আধুনিক ওপেন-সোর্স এলএলএম-এর ভিত্তি এবং তাদের নিজস্ব ব্যাপক প্রয়োগের সাথে সামঞ্জস্যপূর্ণ। এর বিশাল ইকোসিস্টেম এবং অসংখ্য ফাইন-টিউনড সংস্করণ এটিকে সবচেয়ে জনপ্রিয় পছন্দ করে তুলেছে।

  • qwen2 (টংই কিয়ানওয়েন কোয়েন২ সিরিজ), দ্বিতীয় বৃহত্তম পরিবার হিসাবে, চীন এবং এমনকি বিশ্বব্যাপী তার শক্তিশালী প্রতিযোগিতা দেখায়।

  • nomic-bert এবং bert এর উপস্থিতি উল্লেখযোগ্য। যদিও এগুলি সাধারণত "বৃহৎ ভাষার মডেল" (কথোপকথনমূলক) হিসাবে বিবেচিত হয় না, বরং টেক্সট এম্বেডিং বা অন্যান্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ বেস মডেল, তাদের উচ্চ ডেপ্লয়মেন্ট ভলিউম থেকে বোঝা যায় যে ওলামা এই ধরনের কাজের জন্যও ব্যাপকভাবে ব্যবহৃত হয়। ওলামা নির্দিষ্ট অপারেশন (যেমন এম্বেডিং ভেক্টর তৈরি করা) করার সময় স্বয়ংক্রিয়ভাবে একটি ডিফল্ট এম্বেডিং মডেল (যেমন, nomic-embed-text) ডাউনলোড করে, যা সম্ভবত এই পরিবারগুলির উচ্চ র‍্যাঙ্কিংয়ের প্রধান কারণ।

  • গুগলের gemma সিরিজ ( gemma3, gemma, gemma2 সহ) ও গ্রহণযোগ্য গ্রহণের হার দেখায়।

  • deepseek2 এবং phi3 এর মতো অন্যান্য সুপরিচিত মডেল পরিবারগুলিও শীর্ষ দশে স্থান পেয়েছে।

  • mllama বিভিন্ন লামা-ভিত্তিক হাইব্রিড, পরিবর্তিত, বা কমিউনিটি-নামকরণ করা মডেলগুলির একটি সংগ্রহ উপস্থাপন করতে পারে।

৬.৪ শীর্ষ মূল প্যারামিটার আকারের পরিসংখ্যান (Top Original Parameter Size Statistics)

মডেল প্যারামিটারের আকার (details.parameter_size ক্ষেত্র) মডেল স্কেলের একটি গুরুত্বপূর্ণ সূচক। কাঁচা ডেটাতে প্যারামিটারের আকারের বিভিন্ন উপস্থাপনার কারণে (যেমন, "8.0B", "7B", "134.52M"), আমরা সরাসরি এই মূল স্ট্রিংগুলি গণনা করি। নীচে উচ্চ সংখ্যক ডেপ্লয়মেন্ট সহ প্যারামিটার আকারের উপস্থাপনাগুলি রয়েছে:

র‍্যাঙ্ক

প্যারামিটারের আকার (মূল স্ট্রিং)

স্বতন্ত্র আইপি ডেপ্লয়মেন্ট (আনুমানিক)

মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স (আনুমানিক)

1

8.0B

~14480

~52577

2

7.6B

~14358

~28105

3

7.2B

~11233

~22907

4

4B

~9895

~21058

5

7B

~4943

~11738

6

134.52M

~4062

~5266

7

1.5B

~2759

~3596

8

13B

~2477

~3311

9

1.8B

~2034

~2476

10

3.2B

~1553

~2244

11

137M

~1477

~1708

12

12.2B

~1421

~2000

13

32.8B

~1254

~2840

14

14.8B

~1123

~2091

15

4.3B

~943

~1194

Ollama Top Original Parameter Size Statistics

(দ্রষ্টব্য: মানগুলি পূর্বে জিজ্ঞাসিত শীর্ষ ৫০টি মডেলের বিশদ তালিকা থেকে প্যারামিটার তথ্যের একটি সারাংশের উপর ভিত্তি করে আনুমানিক করা হয়েছে।)

প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় প্যারামিটার আকার):

  • ৭বি থেকে ৮বি স্কেলের মডেলগুলি হলো সম্পূর্ণ মূলস্রোত: "8.0B", "7.6B", "7.2B", "7B" ডেপ্লয়মেন্টের সিংহভাগ দখল করে আছে। এটি সাধারণত কমিউনিটিতে খুব জনপ্রিয় মডেলগুলির সাথে সঙ্গতিপূর্ণ, যেমন লামা ২/৩ ৭বি/৮বি সিরিজ, মিস্ট্রাল ৭বি, এবং তাদের বিভিন্ন ফাইন-টিউনড সংস্করণ। এগুলি কর্মক্ষমতা এবং রিসোর্স খরচের মধ্যে একটি ভাল ভারসাম্য বজায় রাখে।

  • ৪বি স্কেলের মডেলগুলিও একটি গুরুত্বপূর্ণ অবস্থানে রয়েছে: "4B" এর উচ্চ ডেপ্লয়মেন্ট উল্লেখযোগ্য।

  • মিলিয়ন-প্যারামিটার স্তরের (এম) লাইটওয়েট মডেলগুলি ব্যাপক: "134.52M" এবং "137M" এর উচ্চ র‍্যাঙ্কিং সম্ভবত এম্বেডিং মডেলগুলির (যেমন nomic-embed-text) জনপ্রিয়তা বা খুব ছোট বিশেষায়িত মডেলগুলির (যেমন smollm সিরিজ) সাথে সম্পর্কিত। এই মডেলগুলি ছোট, দ্রুত, এবং রিসোর্স-সীমাবদ্ধ বা লেটেন্সি-সংবেদনশীল পরিস্থিতির জন্য উপযুক্ত।

  • ১বি-৪বি পরিসরে ছোট মডেলগুলির স্থিতিশীল চাহিদা: "1.5B", "1.8B", "3.2B", "4.3B" এর মতো প্যারামিটার আকারের মডেলগুলিও ব্যবহারকারীদের একটি অংশের কাছে প্রিয়।

  • ১০বি-এর উপরে বড় মডেল: যেমন "13B", "12.2B", "32.8B", "14.8B", যদিও ৭-৮বি স্তরের মতো এতগুলি স্বতন্ত্র আইপি ডেপ্লয়মেন্ট নেই, তবুও তাদের যথেষ্ট ডেপ্লয়মেন্ট ভলিউম রয়েছে, যা আরও সক্ষম মডেলের জন্য একটি কমিউনিটি চাহিদা নির্দেশ করে, তাদের উচ্চ হার্ডওয়্যার প্রয়োজনীয়তা সত্ত্বেও।

৬.৫ শীর্ষ কোয়ান্টাইজেশন স্তর পরিসংখ্যান (Top Quantization Level Statistics)

মডেল কোয়ান্টাইজেশন স্তর (details.quantization_level ক্ষেত্র) মডেলের আকার হ্রাস এবং অনুমান ত্বরান্বিত করার জন্য মডেল দ্বারা গৃহীত ওজন নির্ভুলতা প্রতিফলিত করে। নীচে উচ্চ সংখ্যক ডেপ্লয়মেন্ট সহ কোয়ান্টাইজেশন স্তরগুলি রয়েছে:

র‍্যাঙ্ক

কোয়ান্টাইজেশন স্তর (মূল স্ট্রিং)

স্বতন্ত্র আইপি ডেপ্লয়মেন্ট (আনুমানিক)

মোট ডেপ্লয়মেন্ট ইনস্ট্যান্স (আনুমানিক)

1

Q4_K_M

~20966

~53688

2

Q4_0

~18385

~88653

3

Q4_K_S

~9860

~21028

4

F16

~5793

~9837

5

Q8_0

~596

~1574

6

unknown

~266

~1318

7

Q5_K_M

~97

~283

8

F32

~85

~100

9

Q6_K

~60

~178

10

Q2_K

~54

~140

Ollama Top Quantization Level Statistics

(দ্রষ্টব্য: মানগুলি পূর্বে জিজ্ঞাসিত শীর্ষ ৫০টি মডেলের বিশদ তালিকা থেকে কোয়ান্টাইজেশন তথ্যের একটি সারাংশের উপর ভিত্তি করে আনুমানিক করা হয়েছে।)

প্রাথমিক পর্যবেক্ষণ (জনপ্রিয় কোয়ান্টাইজেশন স্তর):

  • ৪-বিট কোয়ান্টাইজেশন হলো প্রভাবশালী সমাধান: Q4_K_M, Q4_0, এবং Q4_K_S, এই তিনটি ৪-বিট কোয়ান্টাইজেশন স্তর, সম্পূর্ণভাবে চার্টের শীর্ষে রয়েছে। এটি স্পষ্টভাবে নির্দেশ করে যে কমিউনিটি মডেলের কর্মক্ষমতা, অনুমান গতি এবং রিসোর্স দখল (বিশেষত ভিআরএএম) এর মধ্যে সেরা ভারসাম্য অর্জনের জন্য পছন্দের সমাধান হিসাবে ৪-বিট কোয়ান্টাইজেশন ব্যাপকভাবে গ্রহণ করে।

  • F16 (১৬-বিট ফ্লোটিং-পয়েন্ট) এখনও একটি গুরুত্বপূর্ণ স্থান ধরে রেখেছে: একটি অ-কোয়ান্টাইজড (বা শুধুমাত্র মৌলিকভাবে কোয়ান্টাইজড) সংস্করণ হিসাবে, F16 এর উচ্চ ডেপ্লয়মেন্ট দেখায় যে যথেষ্ট সংখ্যক ব্যবহারকারী সর্বোচ্চ মডেল বিশ্বস্ততা অনুসরণ করতে বা তাদের পর্যাপ্ত হার্ডওয়্যার সংস্থান থাকার কারণে এটি পছন্দ করে।

  • Q8_0 (৮-বিট কোয়ান্টাইজেশন) একটি পরিপূরক হিসাবে: ৪-বিট এবং F16 এর মধ্যে একটি বিকল্প সরবরাহ করে।

  • unknown মানগুলির উপস্থিতি: নির্দেশ করে যে কিছু মডেল মেটাডেটায় কোয়ান্টাইজেশন স্তরের তথ্য অনুপস্থিত বা অ-মানক।

৬.৬ এআই কম্পিউটিং পাওয়ার বিতরণ (মডেল প্যারামিটার আকার অনুসারে): চীন বনাম মার্কিন যুক্তরাষ্ট্র (Distribution of AI Computing Power (by Model Parameter Size): China vs. USA)

প্রধান দেশগুলিতে বিভিন্ন স্কেলের মডেলগুলি কীভাবে স্থাপন করা হয় সে সম্পর্কে গভীরতর বোঝার জন্য, আমরা মার্কিন যুক্তরাষ্ট্র এবং চীনে ওলামা ইনস্ট্যান্সে স্থাপন করা মডেলগুলির প্যারামিটার আকারগুলিকে শ্রেণীবদ্ধ এবং গণনা করেছি। প্যারামিটার আকার প্রায়শই মডেল জটিলতা এবং সম্ভাব্য এআই কম্পিউটিং পাওয়ার চাহিদার একটি গুরুত্বপূর্ণ সূচক হিসাবে বিবেচিত হয়।

প্যারামিটার স্কেল শ্রেণিবিন্যাস মানদণ্ড:

  • ছোট: < ১ বিলিয়ন প্যারামিটার (< 1B)

  • মাঝারি: ১ বিলিয়ন থেকে < ১০ বিলিয়ন প্যারামিটার (1B to < 10B)

  • বড়: ১০ বিলিয়ন থেকে < ৫০ বিলিয়ন প্যারামিটার (10B to < 50B)

  • অতিরিক্ত বড়: >= ৫০ বিলিয়ন প্যারামিটার (>= 50B)

নীচের সারণীটি মার্কিন যুক্তরাষ্ট্র এবং চীনে বিভিন্ন প্যারামিটার স্কেলের মডেল স্থাপনকারী স্বতন্ত্র আইপি-র সংখ্যা দেখাচ্ছে:

দেশ

প্যারামিটার স্কেল বিভাগ

স্বতন্ত্র আইপি গণনা

চীন

ছোট (<1B)

3313

চীন

মাঝারি (1B to <10B)

4481

চীন

বড় (10B to <50B)

1548

চীন

অতিরিক্ত বড় (>=50B)

280

মার্কিন যুক্তরাষ্ট্র

ছোট (<1B)

1368

মার্কিন যুক্তরাষ্ট্র

মাঝারি (1B to <10B)

6495

মার্কিন যুক্তরাষ্ট্র

বড় (10B to <50B)

1301

মার্কিন যুক্তরাষ্ট্র

অতিরিক্ত বড় (>=50B)

58

The table below shows the number of unique IPs deploying models of different parameter scales in the US and China

ডেটা অন্তর্দৃষ্টি এবং বিশ্লেষণ:

১. মাঝারি আকারের মডেলগুলি মূলস্রোত, তবে বিভিন্ন ফোকাস সহ: মার্কিন যুক্তরাষ্ট্র: মার্কিন যুক্তরাষ্ট্রে মাঝারি আকারের মডেলগুলির (1B-10B) ডেপ্লয়মেন্ট সম্পূর্ণ প্রভাবশালী (6495 স্বতন্ত্র আইপি)। চীন: চীনে মাঝারি আকারের মডেলগুলি (4481 স্বতন্ত্র আইপি) ও সর্বাধিক স্থাপন করা প্রকার, তবে চীনে ছোট মডেলগুলির (<1B) ডেপ্লয়মেন্ট (3313 স্বতন্ত্র আইপি) খুব উল্লেখযোগ্য। ২. ছোট মডেলগুলিতে উল্লেখযোগ্য পার্থক্য: চীনের ছোট মডেলগুলির বড় আকারের ডেপ্লয়মেন্ট এজ কম্পিউটিং, মোবাইল এআই অ্যাপ্লিকেশন এবং অনুরূপ পরিস্থিতির জন্য একটি পছন্দ প্রতিফলিত করতে পারে। ৩. বড় এবং অতিরিক্ত-বড় মডেলগুলির ডেপ্লয়মেন্ট: চীন বড় এবং অতিরিক্ত-বড় মডেলগুলি অনুসন্ধানে উচ্চতর কার্যকলাপ দেখায় (যদিও একটি ছোট বেস থেকে)। ৪. সামগ্রিক কম্পিউটিং পাওয়ার বিনিয়োগের উপর অনুমান: মাঝারি আকারের মডেলগুলিতে মার্কিন যুক্তরাষ্ট্রের ভিত্তি ব্যবহারিক এআই অ্যাপ্লিকেশনগুলির বিস্তার দেখায়। চীনের ছোট মডেলগুলিতে একটি সুবিধা রয়েছে এবং এটি সক্রিয়ভাবে বড় মডেলগুলি অনুসন্ধান করছে। ৫. বৈশ্বিক প্রবণতার জন্য প্রভাব: মাঝারি আকারের মডেলগুলি সম্ভবত বিশ্বব্যাপী জনপ্রিয়। বিভিন্ন অঞ্চলের তাদের বাস্তুতন্ত্র এবং সম্পদের অবস্থার উপর ভিত্তি করে বিভিন্ন মডেল গ্রহণ কৌশল থাকতে পারে।

চীন এবং মার্কিন যুক্তরাষ্ট্রে মডেল প্যারামিটার স্কেলগুলি ভাগ করে, আমরা দুটি দেশে ওলামা অ্যাপ্লিকেশনগুলির বিভিন্ন ফোকাস এবং উন্নয়ন সম্ভাবনা দেখতে পারি।

৭. নেটওয়ার্ক অন্তর্দৃষ্টি (Network Insights)

৭.১ পোর্ট ব্যবহার (Port Usage)

  • 11434 (ডিফল্ট পোর্ট): ওলামা ইনস্ট্যান্সগুলির সিংহভাগ (৩০,৭২২ স্বতন্ত্র আইপি) ডিফল্ট পোর্ট 11434 এ চলে।

  • অন্যান্য সাধারণ পোর্ট: 80 (১,৬১৯ স্বতন্ত্র আইপি), 8080 (১,৫৭১ স্বতন্ত্র আইপি), 443 (১,৩৩৯ স্বতন্ত্র আইপি) ইত্যাদি পোর্টগুলিও ব্যবহৃত হয়, যা নির্দেশ করতে পারে যে কিছু ইনস্ট্যান্স একটি রিভার্স প্রক্সির পিছনে স্থাপন করা হয়েছে বা ব্যবহারকারীরা পোর্ট কাস্টমাইজ করেছেন।

৭.২ প্রোটোকল ব্যবহার (Protocol Usage)

  • HTTP: প্রায় ৬৫,৫০৬টি স্বতন্ত্র আইপি-র ইনস্ট্যান্স HTTP প্রোটোকলের মাধ্যমে পরিষেবা দিচ্ছে।

  • HTTPS: প্রায় ৪৩,৭৬৫টি স্বতন্ত্র আইপি-র ইনস্ট্যান্স HTTPS প্রোটোকলের মাধ্যমে পরিষেবা দিচ্ছে।

বেশিরভাগ ইনস্ট্যান্স এখনও এনক্রিপ্টবিহীন HTTP এর মাধ্যমে প্রকাশিত হয়, যা নির্দিষ্ট নিরাপত্তা ঝুঁকি তৈরি করতে পারে। (দয়া করে মনে রাখবেন: একটি আইপি HTTP এবং HTTPS উভয়ই সমর্থন করতে পারে, তাই এখানে আইপি গণনার যোগফল মোট স্বতন্ত্র আইপি-র সংখ্যা অতিক্রম করতে পারে)

৭.৩ প্রধান হোস্টিং প্রদানকারী (AS সংস্থা) (Main Hosting Providers (AS Organization))

ওলামা ইনস্ট্যান্স হোস্টিং ক্লাউড পরিষেবা প্রদানকারীদের মধ্যে অত্যন্ত কেন্দ্রীভূত।

র‍্যাঙ্ক

AS সংস্থা

স্বতন্ত্র আইপি গণনা

প্রধান সংশ্লিষ্ট প্রদানকারী

1

AMAZON-02

53658

AWS

2

AMAZON-AES

5539

AWS

3

Chinanet

4964

China Telecom

4

Hangzhou Alibaba Advertising Co.,Ltd.

2647

Alibaba Cloud

5

HENGTONG-IDC-LLC

2391

Hosting Provider

6

Shenzhen Tencent Computer Systems Company Limited

1682

Tencent Cloud

7

CHINA UNICOM China169 Backbone

1606

China Unicom

8

Hetzner Online GmbH

972

Hetzner

9

China Unicom Beijing Province Network

746

China Unicom (Beijing)

10

LEASEWEB-USA-LAX

735

Leaseweb

Ollama instance hosting is highly concentrated among cloud service providers

এডব্লিউএস (AMAZON-02, AMAZON-AES) বৃহত্তম শেয়ার ধারণ করে, তারপরে প্রধান চীনা টেলিকম অপারেটর এবং ক্লাউড পরিষেবা প্রদানকারী (যেমন আলিবাবা ক্লাউড, টেনসেন্ট ক্লাউড)। হেটজনার এবং লিজওয়েবের মতো অন্যান্য হোস্টিং প্রদানকারীদেরও উল্লেখযোগ্য শেয়ার রয়েছে।

৮. নিরাপত্তা এবং অন্যান্য পর্যবেক্ষণ (Security and Other Observations)

  • সংস্করণ তথ্য: নিরাপত্তার কারণে, আমরা ওলামা সংস্করণগুলির পরিসংখ্যান তালিকাভুক্ত করিনি।

  • HTTP এক্সপোজার ঝুঁকি: যেমন আগে উল্লেখ করা হয়েছে, বিপুল সংখ্যক ওলামা ইনস্ট্যান্স টিএলএস এনক্রিপশন ছাড়াই HTTP এর মাধ্যমে প্রকাশিত হয়, যা যোগাযোগের বিষয়বস্তুকে (যেমন, মডেলগুলির সাথে মিথস্ক্রিয়া) আড়িপাতা বা বিকৃতির ঝুঁকিতে ফেলতে পারে। ব্যবহারকারীদের একটি রিভার্স প্রক্সি কনফিগার করতে এবং HTTPS সক্ষম করার পরামর্শ দেওয়া হচ্ছে।

  • এপিআই অ্যাক্সেসযোগ্যতা: এই প্রতিবেদনের ডেটা সেইসব ওলামা ইনস্ট্যান্সের উপর ভিত্তি করে যাদের /api/tags ইন্টারফেস সর্বজনীনভাবে অ্যাক্সেসযোগ্য। প্রকৃত ডেপ্লয়মেন্টের সংখ্যা বেশি হতে পারে, তবে কিছু ইনস্ট্যান্স ব্যক্তিগত নেটওয়ার্কে স্থাপন করা হতে পারে বা ফায়ারওয়াল দ্বারা বাহ্যিক অ্যাক্সেস সীমাবদ্ধ থাকতে পারে।

৯. উপসংহার এবং সংক্ষিপ্ত পর্যালোচনা (Conclusion and Brief Review)

এই প্রতিবেদনটি, বিশ্বব্যাপী ৯৯,৪১২টি সর্বজনীনভাবে অ্যাক্সেসযোগ্য ওলামা ইনস্ট্যান্সের (তাদের /api/tags ইন্টারফেসের মাধ্যমে) ডেটা বিশ্লেষণ করে, নিম্নলিখিত প্রধান উপসংহার এবং পর্যবেক্ষণগুলি प्रस्तुत করে:

১. বিশ্বব্যাপী ডেপ্লয়মেন্টের সংক্ষিপ্তসার এবং ভৌগোলিক বিতরণ:

  • ওলামা, স্থানীয়ভাবে বড় মডেল চালানোর একটি সুবিধাজনক টুল হিসাবে, বিশ্বব্যাপী ব্যাপকভাবে স্থাপন করা হয়েছে। এই বিশ্লেষণে ৯৯,৪১২টি সর্বজনীনভাবে অ্যাক্সেসযোগ্য স্বতন্ত্র আইপি চিহ্নিত করা হয়েছে।

  • উচ্চ ভৌগোলিক ঘনত্ব: মার্কিন যুক্তরাষ্ট্র এবং চীন হলো সেই দুটি দেশ/অঞ্চল যেখানে ওলামা ডেপ্লয়মেন্ট সবচেয়ে বেশি কেন্দ্রীভূত, সম্মিলিতভাবে মোট অ্যাক্সেসযোগ্য ইনস্ট্যান্সের একটি উল্লেখযোগ্য অংশ দখল করে আছে (মার্কিন যুক্তরাষ্ট্র ২৯,১৯৫, চীন ১৬,৪৬৪)। জাপান, জার্মানি, যুক্তরাজ্য, ভারত এবং সিঙ্গাপুরের মতো দেশগুলিতেও উল্লেখযোগ্য ডেপ্লয়মেন্ট সংখ্যা রয়েছে।

  • শহরের হটস্পট: মার্কিন যুক্তরাষ্ট্রে, অ্যাশবার্ন, পোর্টল্যান্ড এবং কলম্বাসের মতো শহরগুলি ডেপ্লয়মেন্টে এগিয়ে আছে; চীনে, বেইজিং, হ্যাংঝৌ, সাংহাই এবং গুয়াংঝৌয়ের মতো প্রযুক্তিগতভাবে উন্নত শহরগুলি প্রধান ডেপ্লয়মেন্টের স্থান। এটি প্রায়শই প্রযুক্তি সংস্থা, ডেটা সেন্টার এবং ডেভেলপার কমিউনিটির ঘনত্বের সাথে সম্পর্কিত।

২. এআই মডেল ডেপ্লয়মেন্টের প্রবণতা:

  • জনপ্রিয় মডেল ট্যাগ: llama3:latest, deepseek-r1:latest, mistral:latest, qwen:latest এর মতো সাধারণ সর্বশেষ ট্যাগগুলি সবচেয়ে জনপ্রিয়। llama3:8b-text-q4_K_S এর মতো বিশেষভাবে অপ্টিমাইজ করা সংস্করণগুলিও তাদের ভাল ভারসাম্যের জন্য পছন্দ করা হয়।

  • প্রভাবশালী মডেল পরিবার: llama পরিবার একটি সম্পূর্ণ ব্যবধানে এগিয়ে আছে, তারপরে qwen2nomic-bert এবং bert এর মতো এম্বেডিং মডেল পরিবারগুলির উচ্চ র‍্যাঙ্কিং উল্লেখযোগ্য, সম্ভবত ওলামার ডিফল্ট আচরণের সাথে সম্পর্কিত।

  • প্যারামিটার আকারের পছন্দ: ৭বি-৮বি প্যারামিটারের মডেলগুলি বর্তমানে মূলস্রোত। মিলিয়ন-প্যারামিটার স্তরের লাইটওয়েট মডেল এবং ১০বি-এর উপরে বড় মডেলগুলিরও তাদের নিজ নিজ বাজার রয়েছে। একটি মার্কিন-চীন তুলনা দেখায় যে মার্কিন যুক্তরাষ্ট্র আরও মাঝারি আকারের মডেল স্থাপন করে, যেখানে চীন ছোট এবং অতিরিক্ত-বড় মডেলগুলি অনুসন্ধানে আরও সক্রিয়।

  • কোয়ান্টাইজেশন স্তরের পছন্দ: ৪-বিট কোয়ান্টাইজেশন (বিশেষত Q4_K_M এবং Q4_0) হলো অপ্রতিরোধ্য পছন্দ। F16, একটি উচ্চ-বিশ্বস্ততার বিকল্প হিসাবে, একটি গুরুত্বপূর্ণ অবস্থানে রয়েছে।

  • মেটাডেটার জটিলতা: মডেল মেটাডেটার বিশ্লেষণ (যেমন, মডেল পরিবার ক্ষেত্র ব্যাখ্যা করা) কখনও কখনও এর রেকর্ড এবং মডেলের নাম বা সাধারণ বোঝার মধ্যে জটিলতা প্রকাশ করে, যা ওপেন-সোর্স ইকোসিস্টেমে মেটাডেটা ব্যবস্থাপনার বৈচিত্র্য তুলে ধরে।

৩. প্রযুক্তিগত পরিকাঠামো:

  • হোস্টিং পরিবেশ: বিপুল সংখ্যক ওলামা ইনস্ট্যান্স এডব্লিউএস, আলিবাবা ক্লাউড, টেনসেন্ট ক্লাউডের মতো প্রধান ক্লাউড পরিষেবা প্রদানকারীদের পাশাপাশি প্রধান জাতীয় টেলিকম অপারেটরদের নেটওয়ার্কে হোস্ট করা হয়।

  • সার্ভিস পোর্ট: ওলামার ডিফল্ট পোর্ট 11434 সর্বাধিক ব্যবহৃত হয়, তবে যথেষ্ট সংখ্যক ইনস্ট্যান্স স্ট্যান্ডার্ড ওয়েব পোর্টের মাধ্যমেও প্রকাশিত হয়।

৪. বস্তুনিষ্ঠ মূল্যায়ন:

  • ওলামার জনপ্রিয়তা: ডেটা স্পষ্টভাবে বিশ্বব্যাপী ডেভেলপার এবং এআই উত্সাহীদের মধ্যে ওলামার উচ্চ গ্রহণের হার দেখায়।

  • ওপেন-সোর্স ইকোসিস্টেমের প্রাণবন্ততা: জনপ্রিয় মডেলগুলির বৈচিত্র্য এবং বিভিন্ন প্যারামিটার এবং কোয়ান্টাইজেশন সংস্করণগুলির ব্যাপক ব্যবহার ওপেন-সোর্স এআই মডেল ইকোসিস্টেমের ক্রমবর্ধমান উন্নয়নকে প্রতিফলিত করে।

  • ব্যবহারকারীর পছন্দের ভারসাম্য: মডেল নির্বাচন করার সময়, ব্যবহারকারীরা মডেলের ক্ষমতা, অপারেশনাল দক্ষতা এবং হার্ডওয়্যার খরচের মধ্যে একটি ভারসাম্য খোঁজার প্রবণতা দেখায়।

  • নিরাপত্তা এবং উন্মুক্ততা: বিপুল সংখ্যক ইনস্ট্যান্স তাদের মডেল তালিকায় সর্বজনীন অ্যাক্সেসের অনুমতি দেয়, যা কমিউনিটির জন্য সুবিধাজনক হলেও নিরাপত্তা ঝুঁকিও তৈরি করতে পারে।

৫. ভবিষ্যতের রূপরেখা:

  • আরও দক্ষ, ছোট মডেলের উত্থান এবং কোয়ান্টাইজেশন প্রযুক্তিতে আরও অগ্রগতির সাথে, ওলামার জন্য ডেপ্লয়মেন্ট বাধা ক্রমাগত হ্রাস পাবে বলে আশা করা হচ্ছে।

  • মডেল মেটাডেটার মানককরণ এবং কমিউনিটি-শেয়ার্ড মডেলগুলি ইকোসিস্টেমের স্বচ্ছতা এবং ব্যবহারযোগ্যতা বাড়ানোর জন্য অত্যন্ত গুরুত্বপূর্ণ।

সংক্ষেপে, ওলামা অত্যাধুনিক বৃহৎ ভাষার মডেলগুলিকে বিস্তৃত ডেভেলপার, গবেষক এবং এমনকি সাধারণ ব্যবহারকারীদের সাথে সংযুক্ত করার একটি গুরুত্বপূর্ণ সেতু হয়ে উঠছে। এই ডেটা বিশ্লেষণ তার বর্তমান বিশ্বব্যাপী ডেপ্লয়মেন্ট স্থিতি এবং ব্যবহারকারীর পছন্দগুলি বোঝার জন্য মূল্যবান অন্তর্দৃষ্টি সরবরাহ করে।

মন্তব্য

comments.comments (0)

Please login first

Sign in