Η AMD καταστρέφει τη Nvidia στην εξόρυξη Bitcoin, μπορεί ποτέ να γεφυρωθεί το κενό;

Λογότυπο Nvidia

Αν ακολουθείτε συνήθως την απόδοση της GPU καθώς σχετίζεται με το gaming, αλλά έχετε περίεργες πληροφορίες σχετικά με την εξόρυξη Bitcoin, πιθανότατα έχετε παρατηρήσει και εκπλαγεί από το γεγονός ότι οι GPU AMD είναι οι μη αμφισβητούμενοι ηγέτες στην απόδοση. Αυτό έρχεται σε πλήρη αντίθεση με την επιχείρηση γραφικών υπολογιστών, όπου η σειρά HD 7000 της AMD παίζει αμυντικό παιχνίδι ενάντια στην οικογένεια προϊόντων Nvidia GK104 / GeForce 600. Στην εξόρυξη Bitcoin, η κατάσταση αντιστρέφεται σχεδόν εντελώς - το Radeon 7970 είναι ικανό 550MHash / δευτερόλεπτο, ενώ το GTX 680 είναι περίπου 1/5 τόσο γρήγορο.

Υπάρχει ένα άρθρο στο Bitcoin Wiki ότι προσπαθεί να εξηγήσει η διαφορά, αλλά το αρχικό κομμάτι γράφτηκε το 2010-2011 και δεν έχει ενημερωθεί από τότε. Αναφέρεται στις αρχιτεκτονικές Fermi και VLIW της AMD και συνεπάγεται ότι η καλύτερη απόδοση της AMD οφείλεται στο ότι έχει πολύ περισσότερους πυρήνες από τις αντίστοιχες κάρτες Nvidia. Αυτό δεν είναι αρκετά ακριβές και δεν εξηγεί γιατί το GTX 680 είναι στην πραγματικότητα πιο αργή από το GTX 580 στην εξόρυξη BTC, παρά το γεγονός ότι έχει πολύ περισσότερους πυρήνες. Αυτό το άρθρο θα εξηγήσει τη διαφορά, θα διευκρινίσει αν οι ανθρακωρύχοι CUDA θα αλλάξουν δραματικά το δέλτα απόδοσης μεταξύ AMD και Nvidia και θα αναφερθεί στο κατά πόσον η απόδοση GPGPU της Nvidia είναι γενικά συγκρίσιμη με αυτήν της AMD αυτές τις μέρες.



Θέματα δεν συζητήθηκαν εδώ περιλαμβάνουν:



  • Φυσαλίδες
  • Επενδυτική ευκαιρία
  • Είτε ASIC είτε όχι, όταν φτάνουν τον επόμενο μήνα, αυτό το καλοκαίρι, στο μέλλον θα καταστρέψει την αγορά εξόρυξης GPU.

Αυτές είναι σημαντικές ερωτήσεις, αλλά δεν αποτελούν το επίκεντρο αυτού του άρθρου. Εμείς θα συζητήστε την απόδοση ισχύος και το Mhash / watt σε κάποιο βαθμό, επειδή αυτοί οι παράγοντες έχουν αντίκτυπο στη σύγκριση της απόδοσης εξόρυξης της AMD έναντι της Nvidia.

Οι μηχανισμοί της εξόρυξης

Η εξόρυξη Bitcoin είναι μια συγκεκριμένη εφαρμογή του αλγορίθμου SHA2-256. Ένας από τους λόγους για τους οποίους οι κάρτες AMD υπερέχουν στην εξόρυξη είναι επειδή οι GPU της εταιρείας διαθέτουν πολλές δυνατότητες που βελτιώνουν την ακέραια απόδοση τους. Αυτό είναι στην πραγματικότητα κάτι περίεργο. Οι φόρτοι εργασίας της GPU ιστορικά έχουν βαρύ σημείο κίνησης, επειδή οι υφές αποθηκεύονται σε ακρίβεια μισού (FP16) ή πλήρους (FP32).



Το ζήτημα γίνεται πιο συγκεχυμένο από το γεγονός ότι όταν η Nvidia άρχισε να σπρώχνει το CUDA, τόνισε ότι το password cracking αποτελεί σημαντική δύναμη των καρτών του. Είναι αλήθεια ότι οι GPU GeForce, ξεκινώντας από το G80, προσέφεραν σημαντικά υψηλότερη κρυπτογραφική απόδοση από τους επεξεργαστές - αλλά το υλικό της AMD πνέει τώρα το Nvidia έξω από το νερό.

Ο πρώτος λόγος για τον οποίο οι κάρτες AMD ξεπερνούν τα αντίστοιχα Nvidia στην εξόρυξη BTC (και η τρέχουσα καταχώριση Bitcoin ισχύει καλύψτε το) επειδή ο αλγόριθμος SHA-256 χρησιμοποιεί μια λειτουργία ακέραιου 32-bit ακέραιου περιστροφής. Αυτό σημαίνει ότι η ακέραια τιμή μετατοπίζεται (εξήγηση εδώ), αλλά τα κομμάτια που λείπουν επισυνάπτονται ξανά στην τιμή. Σε μια δεξιά περιστροφή, τα κομμάτια που πέφτουν από τα δεξιά επανασυνδέονται στα αριστερά. Οι GPU AMD μπορούν να κάνουν αυτήν τη λειτουργία σε ένα μόνο βήμα. Πριν από την κυκλοφορία του GTX Titan, οι GPU της Nvidia απαιτούσαν τρία βήματα - δύο βάρδιες και μια προσθήκη.

Λέμε «πριν από τον Τιτάνα», επειδή ένα από τα χαρακτηριστικά που εισήγαγε η Nvidia με το Compute Capability 3.5 (υποστηρίζεται μόνο στο GTX Titan και το Tesla K20 / K20X) είναι μια αλλαγή διοχέτευσης. Ο επιλογέας διοχέτευσης μπορεί να συνδυάσει λειτουργίες, μειώνοντας σημαντικά την ποινή 3 κύκλων Nvidia. Θα δούμε πόσο βελτιώνεται η απόδοση στιγμιαία, γιατί δεν είναι η μόνη βελτίωση του GK110 σε σχέση με το GK104. Το GK110 έχει επίσης δυνατότητα έως και 64 32-bit ακέραιων αλλαγών ανά SMX (ο Τιτάνας έχει 14 SMX). Αντίθετα, το GK104 μπορούσε να χειριστεί 32 ακέραιες μετατοπίσεις ανά SMX και είχε μόλις οκτώ μπλοκ SMX.



Ικανότητα διδασκαλίας Kepler

Έχουμε επισημάνει τη διαφορά ακέραιας μετατόπισης 32-bit μεταξύ CC 3.0 και CC 3.5.

Η AMD παίζει πράγματα κοντά στο στήθος όσον αφορά τις ακέραιες δυνατότητες 32-bit του Graphics Core Next (GCN), αλλά η εταιρεία έχει επιβεβαιώσει ότι το GCN εκτελεί κώδικα INT32 με τον ίδιο ρυθμό με το κυμαινόμενο σημείο διπλής ακρίβειας. Αυτό συνεπάγεται θεωρητικό μέγιστο ρυθμό αποστολής int32 64 ανά ρολόι ανά CU - διπλό βασικό ποσοστό GK104. Το άλλο πλεονέκτημα της AMD, ωστόσο, είναι ο τεράστιος αριθμός υπολογιστικών μονάδων (CU) που απαρτίζουν μία GPU. Ο Τιτάνας, όπως είπαμε, έχει 14 SMX, σε σύγκριση με τους 32 CU του HD 7970. Η Compute Unit / SMX μπορεί να είναι πολύ πιο σημαντική από τον συνολικό αριθμό πυρήνων σε αυτά τα περιβάλλοντα.

Copyright © Ολα Τα Δικαιώματα Διατηρούνται | 2007es.com