Ανατρέχοντας στην αντίστοιχη βιβλιογραφία μπορούμε να βρούμε περιγραφές για το τι σημαίνουν τα dynamic power και leakage power που εμφανίζονται στα αποτελέσματα στην έξοδο του mcpat. Πιο συγκεκριμένα η διασπορά της ενέργειας που καταναλώνει ο επεξεργαστής που προσωμοιώνουμε έχει τρία βασικά μέρη : dynamic, short-circuit,leakage. Τα ψηφιακά κυκλώματα που αποτελούν τον επεξεργαστή, διασκορπίζουν την δυναμική ενέργεια όταν φορτώνουν και ξεφορτώνουν τα χωρητικά φορτία, ώστε να αλλάξουν state. Η δυναμική ενέργεια είναι ανάλογη της χωρητικότητας του συνολικού φορτίου, της τάσης τροφοδοσίας, της αλλαγής της τάσης κατά την αλλαγή καταστάσεων, της συχνότητας του ρολογιού, και του activity factor.
To leakage power ή αλλιώς η ισχύς διαρροής είναι η ενέργεια που χάνεται στα κυκλώματα.Η διαρροή ισχύος εξαρτάται από το μέγεθος των διόδων(τρανζίστορ) και από τη τοπική κάτασταση των συσκευών.Υπάρχουν δύο μηχανισμοι διαρροής. To Subthreshold leakage συμβαίνει επειδή ένα μικρό ρεύμα περνάει μεταξύ του source και του drain του τρανζίστορ. Το Gate leakage είναι το ρεύμα που διαρρέει από το gate(πύλη), και αλλάζει αρκετά αναλόγως την κατάσταση της συσκευής.
Εάν υπάρχει μεγάλη διαρροή ισχύος (leakage power) στον επεξεργαστή με κατανάλωση 4W, τότε ίσως ο επεξεργαστής με 40W να είναι πιο αποδοτικός και να εκτελεί αυτά που του ανατίθενται πιο γρήγορα και αποτελεσματικά. Με τα αποτελέσματα που παράγει ο McPat μπορούμε να δούμε το ποσοστό dynamic power και leakage power του total power, και να κρίνουμε την αποδοτικότητα του επεξεργαστή. Τα στοιχεία που μπορούν να βοήθησουν σε αυτά τα συμπεράσματα είναι το activity factor.
Xeon (Processor) :
- Area = 410.507 mm^2
- Peak Power = 134.938 W
- Total Leakage = 36.8319 W
- Peak Dynamic = 98.1063 W
- Subthreshold Leakage = 35.1632 W
- Subthreshold Leakage with power gating = 16.3977 W
- Gate Leakage = 1.66871 W
- Runtime Dynamic = 72.9199 W
ARM A9 (Processor) :
- Area = 5.39698 mm^2
- Peak Power = 1.74189 W
- Total Leakage = 0.108687 W
- Peak Dynamic = 1.6332 W
- Subthreshold Leakage = 0.0523094 W
- Gate Leakage = 0.0563774 W
- Runtime Dynamic = 2.96053 W
Όπως φαίνεται από τα αποτελέσματα παραπάνω, το ποσοστό διαρροής του xeon 36.83/134.9 = 27% της συνολικής ισχύς ενώ του ARM A9 0.10/1.74= 5% της συνολικής ισχύς. Άρα ακόμα και εάν ο xeon είναι 40 φορές γρηγορότερος δεν αποτελεί energy efficient λύση σε σχέση με τον ARM A9.
Αρχικά τρέχουμε το mcpat με εισόδους παραμέτρους που προκύπτουν από όλα τα benchmarks του προηγούμενου εργαστήριου με τις default τιμές τους (caches sizes,associativity κλπ). Για να δεχθεί τις παραμέτρους ως είσοδο χρησιμοποιούμε το πρόγραμμα GEM5ToMcPAT.py, το οποίο δημιουργεί ενα .xml αρχείο κατάλληλο για είσοδο στο mcpat, με στοιχεία που αντλεί από τα αντίστοιχα stats.txt και config.json.
Από τα αρχεία σημειώνουμε τις καταναλώσεις ισχύος του κάθε benchmark με είσοδο τις by default τιμές.
benchmarks | Κατανάλωση ισχύος |
---|---|
specbzip | 3.86567 W |
spechmmer | 3.86567 W |
speclibm | 3.86567 W |
spemcf | 3.86567 W |
specsjeng | 3.86567 W |
Όλα τα benchmarks έχουν την ίδια κατανάλωση ισχύος κάτι που είναι απολύτως λογικό, αφού όλα έχουν την ίδια αρχιτεκτονική (default).
Στη συνέχεια τρέχουμε το mcpat για τις διάφορες παραλλαγές αρχιτεκτονικής που κάναμε στο προηγούμενο εργαστήριο. Για το benchmark specbzip από το προηγούμενο εργαστήριο γίναν οι παρακάτω αλλαγές στις παραμέτρους :
- 1 -> default
- 2 -> l1_assoc=1 , l2_assoc=2, cacheline=64 ,l1i_size=64 ,l1d_size=32 , l2_size=512
- 3-> l1_assoc=8 , l2_assoc=16, cacheline=64 ,l1i_size=64 ,l1d_size=32 , l2_size=512
- 4 -> l1_assoc=64 , l2_assoc=64, cacheline=64 ,l1i_size=64 ,l1d_size=64 , l2_size=512
- 5 -> l1_assoc=2 , l2_assoc=8, cacheline=32 ,l1i_size=64 ,l1d_size=32 , l2_size=512
- 6 -> l1_assoc=4 , l2_assoc=16, cacheline=64 ,l1i_size=32 ,l1d_size=64 , l2_size=1MB
- 7 -> l1_assoc=4 , l2_assoc=16, cacheline=64 ,l1i_size=128 ,l1d_size=32 , l2_size=4MB
- 8 -> l1_assoc=8 , l2_assoc=16, cacheline=32 ,l1i_size=64 ,l1d_size=32 , l2_size=1MB
Από τα αρχεία προκύπτουν τα εξής αποτελέσματα όσο αναφορά την συνολική κατανάλωση ισχύος για τον processor.
Α/α | Κατανάλωση ισχύος |
---|---|
1 | 3.86567 W |
2 | 3.78201 W |
3 | 3.78201 W |
4 | 13.6204 W |
5 | 2.17736 W |
6 | 3.8992 W |
7 | 5.05549 W |
8 | 2.57779 W |
Από τα παραπάνω μπορούμε να συμπαιράνουμε ότι τις χαμηλότερες καταναλώσεις ισχύος τις έχουμε για cacheline size = 32. Ενώ για fully associative η κατανάλωση εκτοξεύεται καθιστώντας την συγκεκριμένη αρχιτεκτονική ενεργειακά ασύμφορη. Επιπλέον με μείωση στο μέγεθος των caches παρατηρούμε και κάποια μικρή μείωση στην κατανάλωση ισχύος.
Για τα cores προκύπτει :
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.22483 mm^2 | 0.292178 W | 1.098 W | 0.00726281 W |
2 | 6.91295 mm^2 | 0.0684648 W | 1.09545 W | 0.0072454 W |
3 | 6.91295 mm^2 | 0.0684648 W | 1.09545 W | 0.0072454 W |
4 | 30.6494 mm^2 | 1.91307 W | 1.92679 W | 0.0112924 W |
5 | 5.00756 mm^2 | 0.0566904 W | 0.793678 W | 0.00471982 W |
6 | 6.85161 mm^2 | 0.287461 W | 0.904051 W | 0.00536875 W |
7 | 11.9107 mm^2 | 0.297338 W | 1.25637 W | 0.00808866 W |
8 | 7.22467 mm^2 | 0.12646 W | 0.858226 W | 0.0051696 W |
Για την L2 (total):
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.0038 mm^2 | 0.0142722 W | 0.00472789 W | 0.000571604 W |
2 | 2.0888 mm^2 | 0.0111308 W | 0.0014314 W | 0.000194084 W |
3 | 2.0888 mm^2 | 0.0111308 W | 0.0014314 W | 0.000194084 W |
4 | 2.62489 mm^2 | 0.00498299 W | 0.00196243 W | 0.000269964 W |
5 | 1.97895 mm^2 | 0.0045323 W | 0.00140717 W | 0.000189986 W |
6 | 4.223 mm^2 | 0.00966194 W | 0.00292562 W | 0.000418879 W |
7 | 13.1532 mm^2 | 0.010683 W | 0.00921368 | 0.00112022 W |
8 | 3.8492 mm^2 | 0.00328242 W | 0.00257507 W | 0.000292207 W |
Παρατηρούμε ότι στην περίπτωση 7 όπου έχουμε μεγαλύτερες σε μέγεθος L1 & L2 caches έχουμε και μεγαλύτερο area. Ωστόσο στην περίπτωση 4 έχουμε μεγάλο core area, και αυτό προκύπτει λόγω του ότι είναι fully associative.
Από το εργαστήριο 2 προκύπτει ότι τους καλύτερους χρόνους εκτέλεσης και CPI τους είχαμε στην περίπτωση 7 , ωστόσο αξιόλογους χρόνους εκτέλεσης είχαμε και στις περιπτώσεις 6 & 1. Άρα λόγω της μεγαλύτερης κατανάλωσης στην περίπτωση 7 θα επιλέγαμε κάποια από τις 6 & 1, ώστε να είναι και γρήγορο αλλά και ενεργειακά συμφέρον.
Παρακάτω προκύπτει το γράφημα για τον επεξεργαστή και το πως επηρεάζουν οι διάφορες αλλαγές στις παραμέτρους στο peak power:
Το μικρότερο γινόμενο (peak power)x(χρόνος εκτέλεσης) είναι και το πιο χρονικά & ενεργειακά συμφέρον.
Για το benchmark spechmmer από το προηγούμενο εργαστήριο γίναν οι παρακάτω αλλαγές στις παραμέτρους :
- 1 -> default
- 2 -> --l1d_size=128kB --l1i_size=128kB --l2_size=512kB --l1i_assoc=1 --l1d_assoc=1 --l2_assoc=2
- 3 -> --l1d_size=128kB --l1i_size=128kB --l2_size=512kB --l1i_assoc=32 --l1d_assoc=32 --l2_assoc=64
- 4 ->--l1d_size=32kB --l1i_size=64kB --l2_size=512kB --l1i_assoc=1 --l1d_assoc=1 --l2_assoc=2
- 5 -> --l1d_size=32kB --l1i_size=64kB --l2_size=512kB --l1i_assoc=32 --l1d_assoc=32 --l2_assoc=64
- 6 -> --l1d_size=128kB --l1i_size=128kB --l2_size=4MB --l1i_assoc=8 --l1d_assoc=8 --l2_assoc=16
Από τα αρχεία προκύπτουν τα εξής αποτελέσματα όσο αναφορά την συνολική κατανάλωση ισχύος για τον processor:
Α/α | Κατανάλωση ισχύος |
---|---|
1 | 3.86567 W |
2 | 5.70181 W |
3 | 5.70181 W |
4 | 3.78201 W |
5 | 7.70698 W |
6 | 5.62191 W |
Από τα παραπάνω μπορούμε να συμπαιράνουμε ότι τις χαμηλότερες καταναλώσεις ισχύος τις έχουμε για μικρές σε μέγεθος μνήμες, όπως φαίνεται και στην περίπτωση 4, και στο συγκεκριμένο benchmark μικρό associativity. Επιπλέον την μεγαλύτερη κατανάλωση την πετυχαίνουμε με με μεγάλο associativity όπως προκύπτει από την περίπτωση 5.
Για τα cores προκύπτει :
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.22483 mm^2 | 0.360286 W | 1.098 W | 0.00726281 W |
2 | 14.4308 mm^2 | 0.463326 W | 2.05379 W | 0.0157044 W |
3 | 14.4308 mm^2 | 0.463326 W | 2.05379 W | 0.0157044 W |
4 | 6.91295 mm^2 | 0.0989796 W | 1.09545 W | 0.0072454 W |
5 | 15.8853 mm^2 | 1.08404 W | 1.31516 W | 0.00798565 W |
6 | 10.408 mm^2 | 0.582008 W | 1.17252 W | 0.00681165 W |
Για την L2 (total):
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.0038 mm^2 | 0.00231045 W | 0.00472789 W | 0.000571604 W |
2 | 2.0888 mm^2 | 0.00109722 W | 0.0014314 W | 0.000194084 W |
3 | 2.0888 mm^2 | 0.00109722 W | 0.0014314 W | 0.000194084 W |
4 | 2.0888 mm^2 | 0.00430133 W | 0.0014314 W | 0.000194084 W |
5 | 2.62489 mm^2 | 0.0019128 W | 0.00196243 W | 0.000269964 W |
6 | 13.1532 mm^2 | 0.000929456 W | 0.00921368 W | 0.00112022 W |
Από τα παραπάνω προκύπτει ο συνδυασμός παραμέτρων στην περίπτωση 4 είναι ο πιο ενεργειακά συμφέρον. Επιπλέον παρατηρούμε ότι με μικρότερη μνήμη πετυχαίνουμε και την αναμενόμενη εξοικονόμηση χώρου. Στην περίπτωση 5 όπου αυξήσαμε το associativity παρατηρούμε και αύξηση στο area. Παρακάτω παραθέτουμε τα αντίστοιχα γραφήματα :
Παρόλο που αυξάνεται ο χρόνος εκτέλεσης στην περίπτωση 4, η αύξηση αυτή είναι μικρή και η συγκεκριμένη περίπτωση αποτελεί τον πλέον ενεργειακά-χρονικά συμφέρον συνδυασμό παραμέτρων.
Για το benchmark speclibm από το προηγούμενο εργαστήριο γίναν οι παρακάτω αλλαγές στις παραμέτρους :
- 1 -> default
- 2 -> l1_assoc=32, l2_assoc=64
- 3 -> cacheline_size=32
- 4 -> l1_size = 192 , l2=2MB
- 5 -> l1_size = 256 , l2=1MB
- 6 -> l1_assoc=32, l2_assoc=64, cacheline_size=32
- 7 -> l1_assoc=16 , l2_assoc=32 , l2 4MB, l1i,d=192
Από τα αρχεία προκύπτουν τα εξής αποτελέσματα όσο αναφορά την συνολική κατανάλωση ισχύος για τον processor:
Α/α | Κατανάλωση ισχύος |
---|---|
1 | 3.86567 W |
2 | 7.70698 W |
3 | 7.70698 W |
4 | 5.40494 W |
5 | 5.79582 W |
6 | 2.70268 W |
7 | 6.23863 W |
Στην περίπτωση 6 λόγω του cacheline size = 32 παρατηρούμε την χαμηλότερη κατανάλωση ενώ σε όλες τις άλλες τις περιπτώσεις παρατηρούμε αύξηση της κατανάλωσης ισχύος.
Για τα cores προκύπτει :
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.22483 mm^2 | 0.144724 W | 1.098 W | 0.00726281 W |
2 | 15.8853 mm^2 | 0.453882 W | 1.31516 W | 0.00798565 W |
3 | 15.8853 mm^2 | 0.453882 W | 1.31516 W | 0.00798565 W |
4 | 12.0302 mm^2 | 0.144718 W | 1.78243 W | 0.0133423 W |
5 | 14.6851 mm^2 | 0.188574 W | 2.06561 W | 0.0157712 W |
6 | 6.32318 mm^2 | 0.0708948 W | 0.802835 W | 0.00462048 W |
7 | 11.5463 mm^2 | 0.295584 W | 1.18882 W | 0.00719041 W |
Για την L2 (total):
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.0038 mm^2 | 0.0121169 W | 0.00472789 W | 0.000571604 W |
2 | 2.62489 mm^2 | 0.00654289 W | 0.00196243 W | 0.000269964 W |
3 | 2.62489 mm^2 | 0.00654289 W | 0.00196243 W | 0.000269964 W |
4 | 7.0038 mm^2 | 0.0121152 W | 0.00472789 W | 0.000571604 W |
5 | 4.1658 mm^2 | 0.00970754 W | 0.00278925 W | 0.000397114 W |
6 | 1.93858 mm^2 | 0.00298995 W | 0.0016637 W | 0.000228985 W |
7 | 13.0191 mm^2 | 0.00637575 W | 0.0100874 W | 0.00125466 W |
Από τα παραπάνω προκύπτει ότι στην περίπτωση 6 έχουμε τη μικρότερη κατανάλωση και τα μικρότερα areas, ενώ σε όλες τις υπόλοιπες περιπτώσεις έχουμε αύξηση σε σχέση με τις by-default τιμές παραμέτρων που έχουμε στην περίπτωση 1.
Από τα γραφήματα παρατηρούμε ότι παρόλο την μείωση σε κατανάλωση ισχύος στην περίπτωση 6, υπάρχει συμαντική επιβράνδυση στην ταχύτητα. Στις παραπάνω παραλλαγές ο πιο χρονικά και ενεργεικά συμφέρον συνδυασμός των παραμέτρων της αρχιτεκτονικής, θα ήταν η περίπτωση 1 με τις by-default τιμές. Στους παραπάνω συνδυασμούς χρησιμοποιήσαμε σχεδόν σε όλους μεγάλες μνήμες εξ'ου και η αύξηση στην κατανάλωση ισχύος.
Για το benchmark specsjeng από το προηγούμενο εργαστήριο γίναν οι παρακάτω αλλαγές στις παραμέτρους (όσες δεν αναγράφονται είναι οι by-default):
- 1 -> default
- 2 -> l1_assoc=32, l2_assoc=64
- 3 -> cacheline_size=32
- 4 -> l1_size = 192 , l2=2MB
- 5 -> l1_size = 256 , l2=1MB
- 6 -> l1_assoc=32, l2_assoc=64, cacheline_size=32
- 7 -> assoc=16,32 , l2 = 4MB, l1i,d=192
- 8 -> l1d_size = 64 , l1i_size =128, l2_size = 4MB , assoc=4,16
- 9 -> l1d_size = 32 , l1i_size =64, l2_size = 4MB , assoc=1,2
- 10 -> l1d_size = 128 , l1i_size =128, l2_size = 4MB , assoc=128,256
Από τα αρχεία προκύπτουν τα εξής αποτελέσματα όσο αναφορά την συνολική κατανάλωση ισχύος για τον processor:
Α/α | Κατανάλωση ισχύος |
---|---|
1 | 3.86567 W |
2 | 3.78201 W |
3 | 3.78201 W |
4 | 5.40494 W |
5 | 5.79582 W |
6 | 2.70268 W |
7 | 6.23863 W |
8 | 5.05549 W |
9 | 2.92516 W |
10 | 24.691 W |
Από τα παραπάνω μπορούμε να συμπαιράνουμε ότι τις χαμηλότερες καταναλώσεις ισχύος τις έχουμε για cacheline size = 32 , και μικρά μεγέθη caches.(6) και για χαμηλό associativity (9). Στην περίπτωση 10 όπου έχουμε μεγιστοποιήσει τις caches και το associativity, παρατηρούμε ότι η κατανάλωση ισχύος εκτοξεύεται.
Για τα cores προκύπτει :
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.22483 mm^2 | 0.0933744 W | 1.098 W | 0.00726281 W |
2 | 6.91295 mm^2 | 0.0264444 W | 1.09545 W | 0.0072454 W |
3 | 6.91295 mm^2 | 0.0684648 W | 1.09545 W | 0.0072454 W |
4 | 12.0302 mm^2 | 0.0933722 W | 1.78243 W | 0.0133423 W |
5 | 14.6851 mm^2 | 0.12423 W | 2.06561 W | 0.0157712 W |
6 | 6.32318 mm^2 | 0.0531656 W | 0.802835 W | 0.00462048 W |
7 | 11.5463 mm^2 | 0.235896 W | 1.18882 W | 0.00719041 W |
8 | 11.9107 mm^2 | 0.102178 W | 1.25637 W | 0.00808866 W |
9 | 6.91295 mm^2 | 0.0264721 W | 1.09545 W | 0.0072454 W |
10 | 58.9296 mm^2 | 1.49017 W | 3.18723 W | 0.0177449 W |
Για την L2 (total):
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.0038 mm^2 | 0.0142722 W | 0.00472789 W | 0.000571604 W |
2 | 2.0888 mm^2 | 0.00967722 W | 0.0014314 W | 0.000194084 W |
3 | 2.0888 mm^2 | 0.00967722 W | 0.0014314 W | 0.000194084 W |
4 | 7.0038 mm^2 | 0.00719352 W | 0.00472789 W | 0.000571604 W |
5 | 4.1658 mm^2 | 0.00702895 W | 0.00278925 W | 0.000397114 W |
6 | 1.93858 mm^2 | 0.00336161 W | 0.0016637 W | 0.000228985 W |
7 | 13.0191 mm^2 | 0.00767018 W | 0.0100874 W | 0.00125466 W |
8 | 13.1532 mm^2 | 0.00752361 W | 0.00921368 W | 0.00112022 W |
9 | 12.8774 mm^2 | 0.0176276 W | 0.00887322 W | 0.00107583 W |
10 | 20.6832 mm^2 | 0.0156058 W | 0.0242543 W | 0.00325619 W |
Από τα παραπάνω παρατηρούμε μικρά areas στις περιπτώσεις 2,3 όπου έχουμε σχετικά μεγάλο associativity στην 2 και μικρό cacheline στην 3. Στην περίπτωση 6 έχουμε τα καλύτερα αποτελέσματα όσον αφορά τα areas και την κατανάλωση ισχύος και αυτό οφείλεται στο μικρό cacheline size κυρίως. Στην περίπτωση 10 παρατηρούμε εκτόξευση της κατάναλωσης αλλά και του area, το οποίο ήταν αναμενόμενο για λόγους που αναφέραμε παραπάνω.
Από το γράφημα παρατηρούμε ότι τη χαμηλότερη κατανάλωση την έχουμε στην περίπτωση 6 ωστόσο ο χρόνος εκτέλεσης μειώνοτας το cacheline size αυξάνεται σημαντικά, οπότε δεν είναι και χρονικά συμφέρον η συγκεκριμένη παραμετροποίηση. Από τους χρόνους που βρήκαμε από το προηγούμενο εργαστήριο προκύπτει ο πιο χρονικά και ενεργεικά συνδυασμός παραμέτρων, είναι αυτός της περίπτωσης 9,ο οποίος αποτελεί ένα συνδυασμό χαμηλού associativity και μικρών caches.
Στο προηγούμενο εργαστήριο με βάση τα συμπεράσματα που είχαν προκύψει είχαμε βελτιστοποιήσει όσο γινόταν το benchmark specmcf, κάνοντας τις εξής παραμετροποιήσεις :
- 1 -> default
- 2 -> --l1d_size=32kB --l1i_size=64kB --l2_size=512kB --l1i_assoc=4 --l1d_assoc=4 --l2_assoc=8
- 3 -> --l1d_size=128kB --l1i_size=128kB --l2_size=2MB --l1i_assoc=8 --l1d_assoc=8 --l2_assoc=16
- 4 -> --l1d_size=32kB --l1i_size=32kB --l2_size=512kB --l1i_assoc=2 --l1d_assoc=2 --l2_assoc=4
- Τα 5,6,7 είναι τα ίδια με τα 2,3,4 αντίστοιχα με τη μόνη διαφορά το --cpu-clock=1GHz
Από τα αρχεία προκύπτουν τα εξής αποτελέσματα όσο αναφορά την συνολική κατανάλωση ισχύος για τον processor.
Α/α | Κατανάλωση ισχύος |
---|---|
1 | 3.86567 W |
2 | 3.91854 W |
3 | 5.49615 W |
4 | 2.80767 W |
5 | 3.91854 W |
6 | 5.49615 W |
7 | 2.80767 W |
Για τα cores προκύπτει :
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.22483 mm^2 | 0.292178 W | 1.098 W | 0.00726281 W |
2 | 6.79209 mm^2 | 0.269356 W | 0.904051 W | 0.00536875 W |
3 | 10.408 mm^2 | 0.523131 W | 1.17252 W | 0.00681165 W |
4 | 4.59384 mm^2 | 0.107997 W | 0.696764 W | 0.0036123 W |
5 | 6.79209 mm^2 | 0.274252 W | 0.904051 W | 0.00536875 W |
6 | 10.408 mm^2 | 0.531019 W | 1.17252 W | 0.00681165 W |
7 | 4.59384 mm^2 | 0.109847 W | 0.696764 W | 0.0036123 W |
Για την L2 (total):
Α/A | Area | Runtime Dynamic | Subthreshold Leakage | Gate Leakage |
---|---|---|---|---|
1 | 7.0038 mm^2 | 0.0158679 W | 0.00472789 W | 0.000571604 W |
2 | 2.12555 mm^2 | 0.00093215 W | 0.00148306 W | 0.000201415 W |
3 | 7.67752 mm^2 | 0.000688588 W | 0.00494005 W | 0.000605182 W |
4 | 2.08751 mm^2 | 0.00649737 W | 0.00143628 W | 0.000194587 W |
5 | 2.12555 mm^2 | 0.000949094 W | 0.00148306 W | 0.000201415 W |
6 | 7.67752 mm^2 | 0.000698971 W | 0.00494005 W | 0.000605182 W |
7 | 2.08751 mm^2 | 0.0066087 W | 0.00143628 W | 0.000194587 W |
Από τα παραπάνω προκύπτει ότι η συχνότητα δεν παίζει κάποιο ρόλο στην κατανάλωση ισχύος και στο area. Επίσης προκύπτει ότι στην περίπτωση 4 έχουμε χαμηλότερη κατανάλωση ισχύος, που ίσως να οφείλεται στο σχετικά χαμηλό associativity και μέγεθος των caches.
Το παρακάτω γράφημα από το προηγούμενο εργαστήριο μας δείχνει τους χρόνους εκτέλεσης του benchmark με τις αλλαγές στις παραμέτρους.
Και παρακάτω προκύπτει το γράφημα για τον επεξεργαστή και το πως επηρεάζουν οι διάφορες αλλαγές στις παραμέτρους στο peak power:
Από τα γραφήματα εύκολα φαίνεται ότι η περίπτωση 4 αποτελεί τον καλύτερο συνδυασμό κατανάλωσης ισχύος - ταχύτητας εκτέλεσης.
Τα αποτελέσματα της προσομοίωσης μπορούν να έχουν αρκετά σημαντικό error, και οι προβλεπόμενες τιμές να απέχουν από τις πραγματικές και αυτό μπορεί να οφείλεται στο ότι μερικά μοντέλα επεξεργαστών είναι είτε σε μη ολοκληρωμένο στάδιο, είτε είναι πολύ υψηλού επιπέδου, είτε διότι η προσοσωμοίωση μπορεί να έχει διαφορές από την κατασκευή στο χέρι. Επιπλέον αρκετά μεγάλα σφάλματα μπορούν να παρατηρηθούν στο dynamic power λόγω θορύβου της τάσης είτε λόγω θερμικών απωλειών. Αντίστοιχη βιβλιογραφία υπάρχει εδώ :