Thursday Sep 25, 2025

עונה 4 - פרק 1 - מודל התמלול הגדול בישראל - יניר מרמור

פותחים את עונה 4 עם סיפור קוד-פתוח משולב בינה מלאכותית
בפרק זה אירחנו את יניר מרמור ממכון וויצמן, ממקימי פרויקט “עברית AI” — יוזמה קהילתית לשיפור תמלול דיבור בעברית. דיברנו על איסוף הדאטה הקהילתי, היבטי זכויות יוצרים ואיך הם התמודדו עם הבעיה, בניית דאטה-סטים וגם על האפליקציות הפתוחות (ווב ובוט וואטסאפ) שכבר מתמללות עשרות אלפי שעות בחודש — לצד אתגרי פרטיות ותוכניות להמשך (סטרימינג, דומיינים רפואיים/משפטיים ועוד).

קישורים:


קבוצת וואצפ לעדכונים בפרויקט: 

https://chat.whatsapp.com/CcwpHSezjbQCRvUGuubtkN

 

קבוצת הוואטסאפ לדיונים טכניים יותר: 

https://chat.whatsapp.com/Bpf5DsndFwh9C3Rclk2Oul

 

האתר של הפרויקט: https://www.ivrit.ai/

 

המספר של אליעזר הבוט המתמלל: 055-957-1223

 

הממשק שבו אפשר להעלות הקלטות ולקבל תמלול זריז ואיכותי: 

Transcribe.ivrit.ai 

 

ערוץ היוטיוב להסברים נוספים על תמלול איכותי בכמויות: 

https://youtube.com/@ivrit-ai-l2g?si=9imTFwn8Po_OMmaV

 

ממשק הקלטת חומר אימון למודל: 

https://recital.ivrit.ai/

 

פטראון לתמיכה סמלית במאמץ:

https://www.patreon.com/ivrit_ai

או פייבוקס:

https://links.payboxapp.com/QzVhOJJAzVb 

 

לטכנולוגיים ולטכנולוגיות שבינינו:

כל הקוד שלנו בגיטהאב: https://github.com/ivrit-ai

כל המודלים והדאטהסטים בהאגינגפייס: https://huggingface.co/ivrit-ai

 

מייל לתלונות והצעות 🙃: 

info@ivrit.ai

yair@ivrit.ai 

yoad@ivrit.ai

Comment (0)

No comments yet. Be the first to say something!

Copyright 2022 All rights reserved.

Podcast Powered By Podbean

Version: 20241125