גרפיקה תלת מימדית: החומרה
ATI ו-nVidia הן היצרניות המובילות בתחום הכרטיסים הגרפיים. איזה כרטיס ואיזה שבב עדיף? כיצד תטפל אינטל בצוואר הבקבוק של לוח האם ומה ההבדל בין סרטים למשחקים? על כך בכתבה. חלק שני
בכתבה הראשונה סקרנו את פיתוחי עולם הגרפיקה התלת מימדית בהיבט התוכנה שלהם. כעת הגיע הזמן להתמקד בחומרה, ובעיקר בשתי היצרניות העיקריות: ATI ו-nVidia.
שחקני החומרה: ATI ו-nVidia
בשנים האחרונות, שתי חברות הניעו את השוק: ATI Technologies הקנדית ו-nVidia Corp, מקליפורניה. אך למרבה ההפתעה, החברה המוליכה בכמות ייצור ערכות השבבים הגרפיות היא אינטל, מכיוון שליבת מנוע Intel Extreme Graphics מובנית בכמה גירסאות של ערכות השבבים 845 ו-865 עבור לוחות אם של Pentium 4.
אך המאיץ של אינטל לא מתיימר להתחרות במאיצים הייעודיים למשחקים וברוב המחשבים מותקן גם כרטיס גרפי נפרד בעל ביצועי תלת מימד משופרים. במונחים של משחקיות, Intel Extreme Graphics מספק יכולות לא מרשימות, ואינו תומך ב-Shaders.
המוצרים של ATI
ATI Technologies היתה הראשונה שהציגה כרטיס גרפי שהריץ משחקים מבוססי DX9 - היה זה הכרטיס ATI Radeon 9700, שיצא לשוק לפני כשנה. מאז פיתחה החברה כמה שבבים, כולל Radeon 9600 ו-Radeon 9800, והיא מספקת שבבים ליצרניות כרטיסים כמו Gigabyte, Connect 3D או ASUS.
השבב הגרפי שלה ברמת הביניים, ה-Radeon 9600 XT, תומך ב-DX9 אבל כולל פחות צינורות עיבוד פיקסלים וביצועיו נמוכים משל Radeon 9800 XT. עם זאת, הוא בנוי בתהליך ייצור מתוחכם יותר מה-9800 XT (עם 0.13 מיקרון לעומת 0.15 מיקרון), שבזכות מהירות השעון הבסיסית שלו היא 500 מגהרץ, בהשוואה ל-412 מגהרץ ב-9800 XT.
ה-GPU ברמת הכניסה, 9200, מבוסס על הארכיטקטורה הישנה של Radeon 8500, ותומך ב-Shader של DX8.1 בלבד. סדרת כרטיסי All-in-Wonder כולל מקלט טלוויזיה, יציאות טלוויזיה אנלוגית ויכולות הקלטה, והכרטיסים מופיעים במקביל לסדרות הרגילות, כך שיש כרטיסים העולים 400דולר - כמו ATI All-in-Wonder Radeon 9800 Pro - כמו גם כרטיסים זולים, בכ-100 דולר, כמו All-in-Wonder Radeon 9000, המבוסס על מנוע 8500.
השבבים של nVidia
חברת nVidia מייצרת קו המתחיל עם כרטיס nVidia GeForce FX 5200 (כ-70 דולר), ומגיע עד כרטיס היוקרה GeForce FX 5950 (כ-450 דולר). בניגוד ליריבתה, היא אינה מייצרת כרטיסים גרפיים, ושבביה זמינים אך ורק על כרטיסים המיוצרים על ידי שותפים כמו MSI, Leadtek ו-Abit.
כרטיס הדגל nVidia GeForce FX 5950 בנוי בטכנולוגיה של 0.13 מיקרון. סט התכונות שלו זהה לכרטיס GeForce FX 5900 הישן, אבל מעבד הליבה ואפיק הזיכרון שלו הם במהירויות של 475 מגהרץ ו-950 מגהרץ, בהתאמה. כמו דגם 5900, הוא דורש שני חריצי הרחבה - ה-AGP וה-PCI שלידו - מקום למערכת הקירור הגדולה.
החברה מייצרת גם ערכות שבבים עם גרפיקה מובנית למעבדי AMD Athlon, הקרוי nForce ומציע ביצועי תלת מימד בינוניים - באותו סדר גודל של Extreme Graphics של אינטל - ולא תומך ב-Shaders.
חוסר תאימות
המנועים הגרפיים האחרונים של ATI ו-nVidia מבצעים אפקטים רבים של טקסטורה ללא ירידה באיכות התמונה או במהירות. זה נובע מכך שהמידע על הטקסטורות מטופל כ"נקודה צפה". דורות קודמים של חומרה התייחסו למידע הזה בפורמט Integer, למרות שהחישובים הפנימיים נעשו בפורמט של נקודה צפה.
כיום תומכים בכך כל השבבים שתואמים למפרט DX9, אך יש הבדלים בצורת העבודה. השבב של ATI מעבד את כל המידע בפורמט של נקודה צפה בן 24 ביט, בזמן ש-GeForce FX של nVidia מעבד אותו בנקודה צפה ב-16 או 32 ביט. הבדל זה יצר לא מעט כאבי ראש למפתחי תוכנה, ומשום כך, תוכנות שנכתבו לכרטיסי ATI פועלות לאט על חומרת nVidia.
כרטיס רמת הביניים GeForce FX 5700 מהווה שיפור משמעותי לסדרה GeForce FX 5600. בתוספת מהירות השעון הגדולה, והתמיכה בזיכרון DDR-II מהיר, עלו מוצרי הביניים של nVidia מרמת מתמודדים זוטרים לשווי ערך למשפחת ATI Radeon 9600 XT.
גם הכרטיס nVidia GeForce FX 5200, מרמת כניסה, מריץ אפליקציות DX9, אבל הוא עשוה זאת באיטיו. דגם 5200 הוא בעצם מוצר DirectX8.1 משופר ולא תואם DX9 מלא. משחקים שלא דורשים קצב רענון מסך גדול, נראים טוב למדי בזכות ההצללה הריאליסטית. אבל במשחקי אקשן, יש לבחור בין מהירות לריאליזם, בחירה שאיננו מוכנים לעשות.
צוואר הבקבוק של רוחב הפס: PCI Express
כלי תכנות חזקים, מערכות הפעלה ומנועים גרפיים הופכים חסרי תועלת ללא קישורים מהירים בין המעבד, המנוע הגרפי והזיכרון. הכרטיסים הגרפיים של היום מתאימים לחריץ AGP, כשהמערכות החדשות תומכות ב-AGP X8, עם רוחב פס של 2.1 גיגבייט לשניה (ה-X8 משמעו שמונה פעמים המהירות המקורית של AGP, שהיתה 266 מגהרץ. רוחב הפס מתקבל על ידי הכפלת מהירות השעון במספר הבייטים שרצים במקביל. במקור המכפלה היתה 4x66 ועכשיו היא 8x266).
עבור חלק מהכרטיסים המקצועיים אפשר להשתמש ב-AGP Pro, שמבחינת רוחב הפס הוא כמו X8 אבל היכולת להעברת הספק חשמלי הוגברה כדי לאפשר הוספת רכיבים זוללי אנרגיה לכרטיס.
מסלול אקספרס להעברת נתונים על לוח האם
לפי התוכניות של אינטל, חריץ PCI Express יחליף בשנה הבאה את ה-AGP ואת ה-PCI עם ממשק טורי מהיר במיוחד. PCI-Express הוא טורי, נקודה לנקודה, וניתן לאיגוד (Bundle) בקבוצות של עד 32 ערוצים כדי לקבל את רוחב הפס הדרוש. מהירות התמסורת הבסיסית היא 2.5 גיגהביט לשנייה, ועל ידי איגוד ערוצים אפשר להגיע ל-8 גיגהבייט בדור הראשון ועד פי ארבעה בדור השלישי.
חומרת גרפיקה עתידית תתמוך ב-PCI Express בעל 16 ערוצים, כדי להשיג יכולת העברת מידע אפקטיבית של 4.0 גיגבייט לשניה בדור הראשון. תכונות אלו יאפשרו למשחקים עם תוכנות Shader גישה מהירה למידע שנמצא בזיכרון המערכת.
הכרטיסים הראשונים צפויים להגיע לשוק באמצע השנה, כשלוחות האם הראשונים עם PCI Express יהיו זמינים בשוק. הן ATI והן nVidia עובדות על הדור הבא של המנועים הגרפיים, שידרשו יכולות העברת מידע מהירות יותר ויקבלו כוח מחריץ PCI Express. תוספת העוצמה בביצועים דרושה מכיוון שהגודל והמורכבות גדלים.
אגב, ככל שמהירות השעון והביצועים ילכו ויגדלו, כך גם תגדלנה דרישות האנרגיה שלהם. מכיוון שכך, החום שיפיצו השבבים יגבר גם הוא, ויציג בעיות קירור חדשות. לוחות האם מהדור החדש, כמו BTX של אינטל, מתעתדים לטפל בבעיה זו.
ביצועי הזיכרון יידרשו להשתפר גם הם כדי לעמוד בעומסים שהמנועים הגרפיים מייצרים וייצרו בעתיד. שבבי DDR-II הראשונים כבר משמשים בכמה כרטיסים גרפיים ו-DDR מהיר עוד יותר נמצא בדרכו. גירסה מיוחדת של זיכרון DDR, הקרויה GDDR-III, עתידה כנראה להשתלב בכמה כרטיסים חדשים בחודשים הקרובים. זיכרון זה פועל במהירויות שהן הכפלות של 500 מגהרץ, כלומר מהירות אפקטיבית של 1 גיגבייט.
קומפילציה בדיוק בזמן: לביצועים אופטימליים
משחקי מחשב צריכים להיראות לא רק ריאליסטיים בפרטים השונים, אלא מהירים בציור הפרטים על המסך. זאת בניגוד לסרטי אנימציה, בהם אפשר להקדיש שעות לציור סצנה בת 30 שניות, תהליך הקרוי off-line rendering. מאחר והפעולה במשחק מחשב נוצרת באופן חי, הסצנה צריכה להיות מצוירת בזמן אמת ובמהירות של 30 מסכים לשניה, לפחות.
זה המקום שבו הידור בדיוק בזמן (just-in-time, JIT Compiler) מתממש. בתהליך העבודה המסורתי, המשחק מהודר לייצוג בינארי פעם אחת, כשהקוד הסופי נכתב והאפליקציה נבנית. אבל תוכנות Shader ב-DirectX נוצרות מחדש בכל פעם. מה שמאפשר לעדכוני דרייברים לכלול טכניקות הידור יעילות. שחקנים מקבלים גרפיקה משופרת באמצעות עדכון של הדרייבר, במקום לחכות לגירסת משחק חדשה.
למצוא את נמו - ולצייר אותו
אולפני האנימציה של חברות הסרטים ואולפני האפקטים המיוחדים, מייצרים אנימציה תלת מימדית מרשימה. האולפנים עושים זאת ב-Offline, ומשקיעים שעות בכל תמונה. הדגש הוא על איכות, לא מהירות. ציור סרט בן 30 שניות ו-720 מסכי אנימציה (התקן הוא 24 תמונות לשנייה) לוקח כמה שעות.
סוג כזה של ציור ממוחשב מפיק סצנה ליניארית שתיראה זהה בכל הקרנה. מחיר הרזולוציה הגבוהה והאיכות הפוטוגרפית הוא הקפאת הסרט - כאילו צילמו אותו על פילם. משחקים, מאידך, מציירים את התלת מימד בזמן אמת, מאחר וסצנת האנימציה תלויה במה שהשחקן מחליט לעשות. במקרה הזה קצב רענון המסך מקבל עדיפות על איכות.
מטרת מפתחי השבבים לספק גרפיקה תלת מימדית ואפקטים שיתחרו בסרטים עתירי התקציב. אך בשל ההבדלים הבסיסיים בין אנימציה בזמן אמת וציור Offline, הוליווד תמיד נמצאת צעד או שניים לפני המשחקים מבחינת האיכות ה"סטטית" של התמונות. טכנולוגיות של Shaders והגמישות שהן מביאות למפתחים יעזרו לסגור את הפער הזה, כפוף כמובן לשיפור בעוצמת החומרה.