Annons
Detaljerad sökning
Logga in
Bli medlem
Annons
Toggle navigation
notes
Logga in
search
account_balance
Företag
concierge
Förfrågan
delivery_truck_speed
Boka frakt
storefront
Köp & Sälj
approval_delegation
Erbjudanden
group_add
Jobb
newspaper
Nyheter
edit_square
Bli medlem
person
Mitt konto
diamond_shine
Besök vår webbyrå
Svenska
Engelska
newspaper
Se senaste nyheter
convert_to_text
Skicka in nyhet/pressmeddelande
mark_email_read
Prenumerera på nyhetsbrev
campaign
Annonsering i nyhetsbrev
newsmode
Nyhetsbrev
account_balance
Företag
account_balance
Företag
assignment
Register A-Ö
handshake
Agenturer
contract_edit
Registrera grunduppgifter gratis
concierge
Förfrågan
delivery_truck_speed
Boka frakt
storefront
Köp & Sälj
deployed_code
Produkter
precision_manufacturing
Industrimaskiner
forklift
Truckar
front_loader
Entreprenadmaskiner
agriculture
Lantbruksmaskiner
forest
Skogsmaskiner
local_shipping
Transportfordon
gavel
Auktionsobjekt
assignment
Register A-Ö
approval_delegation
Erbjudanden
approval_delegation
Se aktuella erbjudanden
add_box
Skapa erbjudande
mark_email_read
Prenumerera på erbjudanden
group_add
Jobb
group_add
Sök jobb
assignment
Register A-Ö
newspaper
Nyheter
newspaper
Se senaste nyheter
convert_to_text
Skicka in nyhet/pressmeddelande
mark_email_read
Prenumerera på nyhetsbrev
campaign
Annonsering i nyhetsbrev
newsmode
Nyhetsbrev
edit_square
Bli medlem
edit_square
Bli medlem
playlist_add_check
Funktioner när man är inloggad
auto_read_play
Referenser
person
Mitt konto
diamond_shine
Besök vår webbyrå
Svenska
Engelska
Kontakt
Bli medlem
Startsida
/
Nyheter
/
Se senaste nyheter
/
Red Hat släpper AI-server för hybridmoln
account_balance
Företag
concierge
Förfrågan
delivery_truck_speed
Boka frakt
storefront
Köp & Sälj
approval_delegation
Erbjudanden
group_add
Jobb
newspaper
Nyheter
edit_square
Bli medlem
person
Mitt konto
diamond_shine
Besök vår webbyrå
Svenska
Engelska
newspaper
Se senaste nyheter
convert_to_text
Skicka in nyhet/pressmeddelande
mark_email_read
Prenumerera på nyhetsbrev
campaign
Annonsering i nyhetsbrev
newsmode
Nyhetsbrev
Startsida
/
Nyheter
/
Se senaste nyheter
/
Red Hat släpper AI-server för hybridmoln
Senaste nytt
- Nyheter inom industrivärlden
Tipsa
Red Hat släpper AI-server för hybridmoln
Stödjer alla modeller och acceleratorer
Red Hat AI Inference Server, med vLLM och Neural Magic, ger snabbare och mer kostnadseffektiv AI-inferens i hybridmoln
Red Hat, ledande leverantör av lösningar med öppen källkod, lanserar Red Hat AI Inference Server – ett viktigt steg mot att göra generativ AI (gen AI) mer tillgänglig i hybrida molnmiljöer. Den nya företagsklassade inferensserver, en del av Red Hat AI, bygger på det kraftfullla vLLM-communityprojektet och är förstärkt med Neural Magic-teknologier. Detta möjliggör snabbare, mer resurseffektiv och kostnadseffektiv inferens för alla gen AI-modeller, oavsett accelerator eller molnmiljö. Lösningen kan användas fristående eller integrerat med Red Hat Enterprise Linux AI (RHEL AI) och Red Hat OpenShift AI, och gör det enklare för organisationer att skala upp generativ AI i produktion.
Inferens är AI:ns kärna, där förtränade modeller omvandlar data till verklig nytta. Det är den avgörande kontaktytan mot användaren och kräver snabba, exakta svar. I takt med att generativa AI-modeller blir mer komplexa och skalas upp i produktion, riskerar inferensen att bli en flaskhals som pressar hårdvaran, sänker prestandan och ökar kostnaderna. För att frigöra AI:ns fulla potential krävs därför kraftfulla inferensservrar som effektivt hanterar dessa utmaningar.
Red Hat möter dessa utmaningar med Red Hat AI Inference Server, en öppen, högpresterande inferenslösning med avancerade verktyg för modellkomprimering och optimering. Lösningen gör det möjligt för organisationer att leverera snabbare användarupplevelser och ger full frihet i valet av AI-acceleratorer, modeller och IT-miljöer.
vLLM – driver innovationen inom AI-inferens vidare
Red Hat AI Inference Server bygger på det ledande vLLM-projektet från UC Berkeley, lanserat 2023. Det här community-projektet möjliggör högpresterande generativ AI-inferens med stöd för stora inmatningar, multi-GPU-acceleration och kontinuerlig batching.
Med brett stöd för öppna modeller och tidig integration av ledande frontier-modeller, som bland annat DeepSeek, Gemma, Llama, Llama Nemotron, Mistral och Phi, har vLLM etablerat sig som standard för framtidens AI-inferens – en position som förstärks ytterligare genom dess stöd för öppna, företagsanpassade resonemangsmodeller som Llama Nemotron. Allt fler ledande aktörer ansluter sig till vLLM, vilket bekräftar dess nyckelroll i utvecklingen av nästa generations generativa AI.
vLLM:s breda stöd för fritt tillgängliga modeller – i kombination med dess omedelbara integration av ledande spetsmodeller som DeepSeek, Gemma, Llama, Llama Nemotron, Mistral, Phi med flera, samt öppna modeller för avancerad företagsanpassad logik som Llama Nemotron – positionerar det som en de facto-standard för framtida innovation inom AI-inferens. Allt fler ledande leverantörer av spetsmodeller ansluter sig till vLLM, vilket stärker dess avgörande roll i att forma den generativa AI:ns framtid.
Introduktion av Red Hat AI Inference Server
Red Hat AI Inference Server bygger på den banbrytande tekniken i vLLM och förädlar den till en företagsklassad lösning. Den finns tillgänglig som ett fristående containerbaserat paket eller som en integrerad del av både RHEL AI och Red Hat OpenShift AI.
Oavsett miljö ger Red Hat AI Inference Server användare en robust och fullt stödd version av vLLM, tillsammans med:
•
Avancerade verktyg för intelligent komprimering av LLM-modeller
som kraftigt minskar storleken på både grund- och finjusterade AI-modeller, minimerar resursförbrukningen och bevarar, eller till och med förbättrar, modellens noggrannhet.
•
Optimerat modellarkiv
via Red Hat AI på Hugging Face med direkt åtkomst till validerade modeller för inferens, som ökar effektiviteten 2–4x utan att tumma på noggrannheten.
•
Red Hats företagssupport
och decennier av expertis i att omsätta communityprojekt till stabila produktionslösningar.
•
Tredjepartsstöd
för ökad flexibilitet i driftsättningen, vilket gör att Red Hat AI Inference Server kan köras på icke- Red Hat Linux- och Kubernetesplattformar, i enlighet med Red Hat:s policy för tredjepartsstöd.
Red Hats vision: Alla modeller, alla acceleratorer, alla moln
AI:s framtid bör präglas av obegränsade möjligheter, inte hämmas av infrastruktursilos. Red Hat ser en framtid där organisationer kan använda valfri modell, på vilken accelerator som helst, i vilket moln som helst – och samtidigt leverera en konsekvent, högkvalitativ användarupplevelse utan orimligt höga kostnader. För att realisera den fulla potentialen i generativ AI krävs en universell inferensplattform – en standard för sömlös och kraftfull AI-innovation, både idag och i framtiden.
Precis som Red Hat en gång gjorde Linux till grunden för modern IT, är företaget nu redo att forma framtidens AI-inferens. vLLM har potential att bli standarden för generativ AI-inferens, och Red Hat bygger nu ett starkt ekosystem kring både vLLM-communityn och llm-d för distribuerad inferens i stor skala. Visionen är tydlig: oavsett modell, accelerator eller miljö ska vLLM bli den öppna standarden för inferens i hybridmolnet.
- Inferens är platsen där generativ AI verkligen levererar, där användarinteraktioner besvaras med snabba och träffsäkra svar från modellen. Men det måste ske på ett effektivt och kostnadseffektivt sätt. Red Hat AI Inference Server är utvecklad för att möta kraven på hög prestanda och responsivitet i stor skala, samtidigt som resursanvändningen hålls nere. Den fungerar som ett gemensamt inferenslager som stödjer alla modeller, på alla acceleratorer, i vilken miljö som helst, säger Joe Fernandes, vice president och general manager, AI Business Unit på Red Hat.
2025-05-21
-
Industritorget
SENASTE NYTT
- Nyheter inom industrivärlden
Tipsa
Dansk design med hög kvalitet
20
26
0
4
1
6
Stilrena och hållbara designartiklar
Endast 1 vecka kvar till öppet hus
20
26
0
4
1
6
Du har väl inte missat att anmäla dig?
Besök Iscar på Elmia Verktygsmaskiner
20
26
0
4
1
6
Monter B05:28 den 19–22 maj
Ny klimatpremie för eldrivna arbetsfordon
20
26
0
4
1
6
Statligt stöd införs 2026
Planslipning som slutbearbetning
20
26
0
4
1
6
av maskinkomponenter
Rätt transmission från början
20
26
0
4
1
6
Så optimerar du prestanda och livslängd
ISCAR utökar JET LINE-sortimentet
20
26
0
4
1
6
Nya fräsverktyg ökar produktiviteten
300 000 robotoperationer i Norden
20
26
0
4
1
6
Milstolpe för da Vinci-systemet
Strategiska materialval stärker VVS-företag
20
26
0
4
1
6
Bättre konkurrenskraft genom smarta val
Det osynliga hotet i materialflöden
20
26
0
4
1
5
– så påverkar metallföroreningar drift, kostnader och produktion
Tungsten förbättrar arbetshandskar
20
26
0
4
1
5
Ökat skydd och komfort
Olsons levererar Hürsan-servopressar
20
26
0
4
1
5
Kundanpassade lösningar till industrin
KJK Lagerprodukter lanserar webbshop
20
26
0
4
1
5
Enklare köp av lagerinredning online
Ny 3-fas strömförsörjning
20
26
0
4
1
5
Delta DIN Eco Series
Ny laserkälla för precisionsmätning
20
26
0
4
1
5
660 nm VCSEL med stabil polarisation
Skydda elektronik effektivt och hållbart
20
26
0
4
1
5
Lösningar för lång livslängd
Skicka in pressmeddelande
Populära artiklar
Senaste veckan
Senaste månaden
KJK Lagerprodukter lanserar webbshop
Koncentra tillkännager VD-övergång
Tungsten förbättrar arbetshandskar
Så väljer du rätt skyddsslang
Ny laserkälla för precisionsmätning
Nya krav på kylaggregat
Ny 3-fas strömförsörjning
Senaste inom tryckmätning från Keller
Happiness for people
NORD DRIVESYSTEMS på Seafood Expo 2026
KJK Lagerprodukter lanserar webbshop
Koncentra tillkännager VD-övergång
Tungsten förbättrar arbetshandskar
Så väljer du rätt skyddsslang
Ny laserkälla för precisionsmätning
Nya krav på kylaggregat
Ny 3-fas strömförsörjning
Senaste inom tryckmätning från Keller
Happiness for people
NORD DRIVESYSTEMS på Seafood Expo 2026
Koncentra tillkännager VD-övergång
20
26
0
4
1
5
Nya krav på kylaggregat
20
26
0
4
1
5
Jetstream Tooling M-Klamp
20
26
0
4
1
5
CleverReader – kompakt kodläsare
20
26
0
4
1
5
QuantuMike MD-E vinner iF Design Award
20
26
0
4
1
5
Optimizely utses till CMP-ledare
20
26
0
4
1
5
Skräddarsydda lösningar ökar kraftigt
20
26
0
4
1
5
Så väljer du rätt skyddsslang
20
26
0
4
1
5
Senaste inom tryckmätning från Keller
20
26
0
4
1
4
Gummirullar och hjul – leverans och renovering
20
26
0
4
1
4
Walter lanserar Xtra·tec® S3
20
26
0
4
1
4
Happiness for people
20
26
0
4
1
4
NORD DRIVESYSTEMS på Seafood Expo 2026
20
26
0
4
1
4
I en komplett företagsprofil ingår
Logotyp
Kontaktuppgifter
Kontaktpersoner
Verksamhetsbeskrivning
Tjänster & Produkter
Nyheter
Filmer
Länkar: Hemsida, Facebook, Instagram, LinkedIn m.fl.
Filer (t.ex. pdf)
Agenturer
Certifieringar
Karta
Se exempel på ett tjänsteföretags profil:
Gnosjö Automatsvarvning AB
Se exempel på ett företag som säljer produkter:
AJ Produkter AB
Lagerfilsöverföring för Köp & Sälj
Gör som ex.
Gnosjö Maskin & Verktyg AB
, publicera alla
era produkter på en gång genom lagerfilsöverföring.
Ladda ner information/kravspecifikation för lagerfilsöverföring här »
Accesspaket för Köp & Sälj
Vi kan erbjuda er en färdigbyggd lösning som automatiskt skickar över produkterna till er egna hemsida, så att ni slipper lägga in dessa manuellt. Produkten som vi kallar för Accesspaket är dessutom responsiv, d.v.s. mobilanpassad, för att kunderna alltid ska kunna se era objekt på ett bra sätt.
För mer information, vänligen kontakta vår support så kan de berätta mer kring våra funktioner och vad dessa innebär.
Se ex. på
DeWi ABs hemsida
.
call
X
Välkommen att kontakta oss
Kontaktuppgifter
account_balance
Industritorget Sweden AB
call
+46 35 260 32 00
alternate_email
Skicka e-post
i
Vi finns här för dig på vardagar mellan
08:00 - 17:00
och hjälper dig att komma i kontakt med rätt person.
Gå till kontakta oss