Thursday Sep 25, 2025

עונה 4 - פרק 1 - מודל התמלול הגדול בישראל - יניר מרמור

פותחים את עונה 4 עם סיפור קוד-פתוח משולב בינה מלאכותית
בפרק זה אירחנו את יניר מרמור ממכון וויצמן, ממקימי פרויקט “עברית AI” — יוזמה קהילתית לשיפור תמלול דיבור בעברית. דיברנו על איסוף הדאטה הקהילתי, היבטי זכויות יוצרים ואיך הם התמודדו עם הבעיה, בניית דאטה-סטים וגם על האפליקציות הפתוחות (ווב ובוט וואטסאפ) שכבר מתמללות עשרות אלפי שעות בחודש — לצד אתגרי פרטיות ותוכניות להמשך (סטרימינג, דומיינים רפואיים/משפטיים ועוד).

קישורים:

קבוצת וואצפ לעדכונים בפרויקט:

https://chat.whatsapp.com/CcwpHSezjbQCRvUGuubtkN

קבוצת הוואטסאפ לדיונים טכניים יותר:

https://chat.whatsapp.com/Bpf5DsndFwh9C3Rclk2Oul

האתר של הפרויקט: https://www.ivrit.ai/

המספר של אליעזר הבוט המתמלל: 055-957-1223

הממשק שבו אפשר להעלות הקלטות ולקבל תמלול זריז ואיכותי:

Transcribe.ivrit.ai

ערוץ היוטיוב להסברים נוספים על תמלול איכותי בכמויות:

https://youtube.com/@ivrit-ai-l2g?si=9imTFwn8Po_OMmaV

ממשק הקלטת חומר אימון למודל:

https://recital.ivrit.ai/

פטראון לתמיכה סמלית במאמץ:

https://www.patreon.com/ivrit_ai

או פייבוקס:

https://links.payboxapp.com/QzVhOJJAzVb

לטכנולוגיים ולטכנולוגיות שבינינו:

כל הקוד שלנו בגיטהאב: https://github.com/ivrit-ai

כל המודלים והדאטהסטים בהאגינגפייס: https://huggingface.co/ivrit-ai

מייל לתלונות והצעות 🙃:

info@ivrit.ai

yair@ivrit.ai

yoad@ivrit.ai

Comment (0)

No comments yet. Be the first to say something!