Thursday, April 2, 2015

Some Solaris Single-Threaded numbers (Benchmarks?)

Solaris 10 Bench numbers - SysWiki

Some Solaris 10 Bench numbers (single-threaded)

1. Benchmark Technical Information

1.1 Introduction

'nbench' is an old benchmark which was written long before machines had as many cpu packages as those from today.
Nowdays it's still useful because it approximates the kind of performance one can get from a single-thread on your system (Some 3rd party vendors still provide software that's either single-threaded or has so many locking issues that it exhibits performance akin to that of a single-threaded application).
What interest is there in having 1,024 cpus in a single machine if your message passing middleware runs as a single-threaded task due to poor concurrency programming? In this very specific use case, it's good to be able to have metrics on the single-threaded performance of several machines to figure where the above task might run best.

1.2 nbench v2.2.3 executable information (SPARC)

# file nbench
nbench:         ELF 32-bit MSB executable SPARC Version 1, dynamically linked, stripped

# ldd nbench
       libm.so.2 =>     /lib/libm.so.2
       libc.so.1 =>     /lib/libc.so.1
       /platform/SUNW,SPARC-Enterprise-T5120/lib/libc_psr.so.1

# pvs nbench
       libm.so.2 (SUNW_1.1);
       libc.so.1 (SYSVABI_1.3);


1.3 nbench v2.2.3 executable information (x86)

# file nbench
nbench:         ELF 32-bit MSB executable SPARC Version 1, dynamically linked, stripped

# ldd nbench
       libm.so.2 =>     /lib/libm.so.2
       libc.so.1 =>     /lib/libc.so.1

# pvs nbench
       libm.so.2 (SUNW_1.1);
       libc.so.1 (SYSVABI_1.3, SUNWprivate_1.1);

1.4 Compiler (Lack of) Optimization Options (SPARC)

# /usr/local/bin/gcc --version
gcc (GCC) 3.4.6
Copyright (C) 2006 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

CFLAGS = -s -Wall -O3 -fomit-frame-pointer -funroll-loops -pipe

1.5 Compiler (Lack of) Optimization Options (x86)

# /usr/sfw/bin/gcc --version
gcc (GCC) 3.4.3 (csl-sol210-3_4-branch+sol_rpath)
Copyright (C) 2004 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

CFLAGS = -s -Wall -O3 -fomit-frame-pointer -funroll-loops -pipe

2. Results

2.1 SunFire V215, US-IIIi 1.504GHz

# psrinfo -pv
The physical processor has 1 virtual processor (0)
  UltraSPARC-IIIi (portid 0 impl 0x16 ver 0x34 clock 1504 MHz)
The physical processor has 1 virtual processor (1)
  UltraSPARC-IIIi (portid 1 impl 0x16 ver 0x34 clock 1504 MHz)

# ./nbench

BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          675.96  :      17.34  :       5.69
STRING SORT         :           97.24  :      43.45  :       6.73
BITFIELD            :      1.2021e+08  :      20.62  :       4.31
FP EMULATION        :          55.596  :      26.68  :       6.16
FOURIER             :           10208  :      11.61  :       6.52
ASSIGNMENT          :           8.828  :      33.59  :       8.71
IDEA                :          913.06  :      13.97  :       4.15
HUFFMAN             :          896.77  :      24.87  :       7.94
NEURAL NET          :          13.262  :      21.30  :       8.96
LU DECOMPOSITION    :          539.72  :      27.96  :      20.19
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 24.181
FLOATING-POINT INDEX: 19.052
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 6.320
INTEGER INDEX       : 5.828
FLOATING-POINT INDEX: 10.567
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.2 SunFire E6900, US-IV+ 1.8GHz

# psrinfo -pv
The physical processor has 2 virtual processors (20 532)
  UltraSPARC-IV+ (portid 20 impl 0x19 ver 0x24 clock 1800 MHz)
The physical processor has 2 virtual processors (21 533)
  UltraSPARC-IV+ (portid 21 impl 0x19 ver 0x24 clock 1800 MHz)
The physical processor has 2 virtual processors (22 534)
  UltraSPARC-IV+ (portid 22 impl 0x19 ver 0x24 clock 1800 MHz)
The physical processor has 2 virtual processors (23 535)
  UltraSPARC-IV+ (portid 23 impl 0x19 ver 0x24 clock 1800 MHz)

# ./nbench

BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          783.96  :      20.11  :       6.60
STRING SORT         :          136.56  :      61.02  :       9.44
BITFIELD            :      1.4217e+08  :      24.39  :       5.09
FP EMULATION        :          66.933  :      32.12  :       7.41
FOURIER             :           12832  :      14.59  :       8.20
ASSIGNMENT          :           10.33  :      39.31  :      10.20
IDEA                :          1302.6  :      19.92  :       5.92
HUFFMAN             :          1006.3  :      27.91  :       8.91
NEURAL NET          :          16.374  :      26.30  :      11.06
LU DECOMPOSITION    :          625.68  :      32.41  :      23.41
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 29.826
FLOATING-POINT INDEX: 23.172
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 7.886
INTEGER INDEX       : 7.127
FLOATING-POINT INDEX: 12.852
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.3 Sun M5000, SPARC64 VI 2.15GHz

# psrinfo -pv
The physical processor has 4 virtual processors (0-3)
  SPARC64-VI (portid 1024 impl 0x6 ver 0x93 clock 2150 MHz)
The physical processor has 4 virtual processors (8-11)
  SPARC64-VI (portid 1032 impl 0x6 ver 0x93 clock 2150 MHz)
The physical processor has 4 virtual processors (32-35)
  SPARC64-VI (portid 1056 impl 0x6 ver 0x93 clock 2150 MHz)
The physical processor has 4 virtual processors (40-43)
  SPARC64-VI (portid 1064 impl 0x6 ver 0x93 clock 2150 MHz)

# ./nbench

BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1056.6  :      27.10  :       8.90
STRING SORT         :          151.28  :      67.60  :      10.46
BITFIELD            :      1.5661e+08  :      26.86  :       5.61
FP EMULATION        :          82.727  :      39.70  :       9.16
FOURIER             :           16788  :      19.09  :      10.72
ASSIGNMENT          :          13.786  :      52.46  :      13.61
IDEA                :          1336.8  :      20.45  :       6.07
HUFFMAN             :          1161.1  :      32.20  :      10.28
NEURAL NET          :          26.425  :      42.45  :      17.86
LU DECOMPOSITION    :          833.28  :      43.17  :      31.17
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 35.237
FLOATING-POINT INDEX: 32.705
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 9.279
INTEGER INDEX       : 8.446
FLOATING-POINT INDEX: 18.139
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.4 Sun M5000, SPARC64 VII 2.4GHz

# psrinfo -pv
The physical processor has 8 virtual processors (0-7)
  SPARC64-VII (portid 1024 impl 0x7 ver 0x90 clock 2400 MHz)
The physical processor has 8 virtual processors (8-15)
  SPARC64-VII (portid 1032 impl 0x7 ver 0x90 clock 2400 MHz)
The physical processor has 8 virtual processors (32-39)
  SPARC64-VII (portid 1056 impl 0x7 ver 0x90 clock 2400 MHz)
The physical processor has 8 virtual processors (40-47)
  SPARC64-VII (portid 1064 impl 0x7 ver 0x90 clock 2400 MHz)
<root@sueora301> /net/suhtst301/export/sun/softs_divers/nbench-byte-2.2.3

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :            1173  :      30.08  :       9.88
STRING SORT         :          165.12  :      73.78  :      11.42
BITFIELD            :      1.9796e+08  :      33.96  :       7.09
FP EMULATION        :           102.4  :      49.14  :      11.34
FOURIER             :           18221  :      20.72  :      11.64
ASSIGNMENT          :          15.238  :      57.98  :      15.04
IDEA                :          1479.1  :      22.62  :       6.72
HUFFMAN             :          1291.4  :      35.81  :      11.44
NEURAL NET          :          28.064  :      45.08  :      18.96
LU DECOMPOSITION    :           886.4  :      45.92  :      33.16
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 40.344
FLOATING-POINT INDEX: 35.006
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 10.680
INTEGER INDEX       : 9.631
FLOATING-POINT INDEX: 19.415
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
    

2.5 Sun M5000, SPARC64 VII+ 2.66GHz

# psrinfo -pv
The physical processor has 8 virtual processors (0-7)
  SPARC64-VII+ (portid 1024 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (8-15)
  SPARC64-VII+ (portid 1032 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (16-23)
  SPARC64-VII+ (portid 1040 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (24-31)
  SPARC64-VII+ (portid 1048 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (32-39)
  SPARC64-VII+ (portid 1056 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (40-47)
  SPARC64-VII+ (portid 1064 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (48-55)
  SPARC64-VII+ (portid 1072 impl 0x7 ver 0xc1 clock 2660 MHz)
The physical processor has 8 virtual processors (56-63)
  SPARC64-VII+ (portid 1080 impl 0x7 ver 0xc1 clock 2660 MHz)

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1241.9  :      31.85  :      10.46
STRING SORT         :           177.2  :      79.18  :      12.26
BITFIELD            :      2.1162e+08  :      36.30  :       7.58
FP EMULATION        :          109.52  :      52.55  :      12.13
FOURIER             :           17624  :      20.04  :      11.26
ASSIGNMENT          :          16.296  :      62.01  :      16.08
IDEA                :          1586.5  :      24.26  :       7.20
HUFFMAN             :          1384.3  :      38.39  :      12.26
NEURAL NET          :          29.923  :      48.07  :      20.22
LU DECOMPOSITION    :           940.2  :      48.71  :      35.17
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 43.135
FLOATING-POINT INDEX: 36.069
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 : 
L2 Cache            : 
OS                  : SunOS 5.10
C compiler          : 
libc                : 
MEMORY INDEX        : 11.433
INTEGER INDEX       : 10.288
FLOATING-POINT INDEX: 20.005
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
        

2.6 Sun T2000, Niagara T1 1.2 GHz

# psrinfo -pv
The physical processor has 32 virtual processors (0-31)
  UltraSPARC-T1 (cpuid 0 clock 1200 MHz)

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          249.84  :       6.41  :       2.10
STRING SORT         :          13.265  :       5.93  :       0.92
BITFIELD            :      5.8499e+07  :      10.03  :       2.10
FP EMULATION        :          14.496  :       6.96  :       1.61
FOURIER             :          1606.1  :       1.83  :       1.03
ASSIGNMENT          :          2.7376  :      10.42  :       2.70
IDEA                :          501.93  :       7.68  :       2.28
HUFFMAN             :          401.99  :      11.15  :       3.56
NEURAL NET          :          1.1157  :       1.79  :       0.75
LU DECOMPOSITION    :          37.285  :       1.93  :       1.39
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 8.138
FLOATING-POINT INDEX: 1.849
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 1.732
INTEGER INDEX       : 2.288
FLOATING-POINT INDEX: 1.026
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
            

2.7 Sun T5120, Niagara T2 1.165 GHz

# psrinfo -pv
The physical processor has 64 virtual processors (0-63)
  UltraSPARC-T2 (cpuid 0 clock 1165 MHz)

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          250.96  :       6.44  :       2.11
STRING SORT         :          15.823  :       7.07  :       1.09
BITFIELD            :      5.3319e+07  :       9.15  :       1.91
FP EMULATION        :          12.623  :       6.06  :       1.40
FOURIER             :          4592.9  :       5.22  :       2.93
ASSIGNMENT          :           2.352  :       8.95  :       2.32
IDEA                :           353.5  :       5.41  :       1.61
HUFFMAN             :          420.13  :      11.65  :       3.72
NEURAL NET          :          4.1916  :       6.73  :       2.83
LU DECOMPOSITION    :          131.44  :       6.81  :       4.92
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 7.567
FLOATING-POINT INDEX: 6.210
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 1.693
INTEGER INDEX       : 2.049
FLOATING-POINT INDEX: 3.444
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.8 Sun T5240, Niagara T2+ 1.165 GHz

# psrinfo -pv
  UltraSPARC-T2+ (cpuid 0 clock 1165 MHz)
The physical processor has 64 virtual processors (64-127)
  UltraSPARC-T2+ (cpuid 64 clock 1165 MHz)

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          251.04  :       6.44  :       2.11
STRING SORT         :          15.833  :       7.07  :       1.10
BITFIELD            :      5.3451e+07  :       9.17  :       1.92
FP EMULATION        :          12.515  :       6.01  :       1.39
FOURIER             :          4575.2  :       5.20  :       2.92
ASSIGNMENT          :          2.3474  :       8.93  :       2.32
IDEA                :          353.64  :       5.41  :       1.61
HUFFMAN             :          420.13  :      11.65  :       3.72
NEURAL NET          :          4.1916  :       6.73  :       2.83
LU DECOMPOSITION    :          131.32  :       6.80  :       4.91
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 7.560
FLOATING-POINT INDEX: 6.200
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 1.694
INTEGER INDEX       : 2.045
FLOATING-POINT INDEX: 3.439
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.9 Sun/Oracle SPARC T4-4, T4 2.998GHz

# psrinfo -pv
The physical processor has 64 virtual processors (0-63)
  SPARC-T4 (chipid 0, clock 2998 MHz)
The physical processor has 64 virtual processors (64-127)
  SPARC-T4 (chipid 1, clock 2998 MHz)
The physical processor has 64 virtual processors (128-191)
  SPARC-T4 (chipid 2, clock 2998 MHz)
The physical processor has 64 virtual processors (192-255)
  SPARC-T4 (chipid 3, clock 2998 MHz)

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)
TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          899.84  :      23.08  :       7.58
STRING SORT         :          194.76  :      87.02  :      13.47
BITFIELD            :      2.7142e+08  :      46.56  :       9.72
FP EMULATION        :           64.44  :      30.92  :       7.14
FOURIER             :           12784  :      14.54  :       8.17
ASSIGNMENT          :          18.656  :      70.99  :      18.41
IDEA                :          1055.5  :      16.14  :       4.79
HUFFMAN             :          1838.1  :      50.97  :      16.28
NEURAL NET          :          26.335  :      42.30  :      17.79
LU DECOMPOSITION    :          760.44  :      39.39  :      28.45
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 40.174
FLOATING-POINT INDEX: 28.936
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          :
libc                :
MEMORY INDEX        : 13.411
INTEGER INDEX       : 8.059
FLOATING-POINT INDEX: 16.049
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
* Trademarks are property of their respective holder.

2.10 Solaris10 VM on VM8 (Dell Precision T5400, 2*L5420 Xeon 2.5GHz)

# psrinfo -pv
The physical processor has 1 virtual processor (0)
  x86 (chipid 0x0 GenuineIntel family 6 model 23 step 10 clock 2493 MHz)
        Intel(r) Xeon(r) CPU           L5420  @ 2.50GHz
The physical processor has 1 virtual processor (1)
  x86 (chipid 0x2 GenuineIntel family 6 model 23 step 10 clock 2493 MHz)
        Intel(r) Xeon(r) CPU           L5420  @ 2.50GHz

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1338.7  :      34.33  :      11.28
STRING SORT         :          174.09  :      77.79  :      12.04
BITFIELD            :      5.2355e+08  :      89.81  :      18.76
FP EMULATION        :          110.24  :      52.90  :      12.21
FOURIER             :           22258  :      25.31  :      14.22
ASSIGNMENT          :          41.886  :     159.39  :      41.34
IDEA                :          3516.8  :      53.79  :      15.97
HUFFMAN             :          2473.1  :      68.58  :      21.90
NEURAL NET          :           33.88  :      54.42  :      22.89
LU DECOMPOSITION    :          1567.6  :      81.21  :      58.64
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 69.017
FLOATING-POINT INDEX: 48.184
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          : gcc version 3.4.3 (csl-sol210-3_4-branch+sol_rpath)
libc                :
MEMORY INDEX        : 21.057
INTEGER INDEX       : 14.812
FLOATING-POINT INDEX: 26.725
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.11 HP Proliant DL580 G7, X7550 4*Xeon 2.00GHz

# psrinfo -pv
The physical processor has 8 virtual processors (0-7)
  x86 (chipid 0x0 GenuineIntel family 6 model 46 step 6 clock 2000 MHz)
        Intel(r) Xeon(r) CPU           X7550  @ 2.00GHz
The physical processor has 8 virtual processors (8-15)
  x86 (chipid 0x1 GenuineIntel family 6 model 46 step 6 clock 2000 MHz)
        Intel(r) Xeon(r) CPU           X7550  @ 2.00GHz
The physical processor has 8 virtual processors (16-23)
  x86 (chipid 0x2 GenuineIntel family 6 model 46 step 6 clock 2000 MHz)
        Intel(r) Xeon(r) CPU           X7550  @ 2.00GHz
The physical processor has 8 virtual processors (24-31)
  x86 (chipid 0x3 GenuineIntel family 6 model 46 step 6 clock 2000 MHz)
        Intel(r) Xeon(r) CPU           X7550  @ 2.00GHz

# ./nbench
BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1117.9  :      28.67  :       9.42
STRING SORT         :          329.28  :     147.13  :      22.77
BITFIELD            :      4.8199e+08  :      82.68  :      17.27
FP EMULATION        :           95.76  :      45.95  :      10.60
FOURIER             :           22073  :      25.10  :      14.10
ASSIGNMENT          :          38.811  :     147.68  :      38.31
IDEA                :          3062.2  :      46.84  :      13.91
HUFFMAN             :          1823.2  :      50.56  :      16.14
NEURAL NET          :          33.546  :      53.89  :      22.67
LU DECOMPOSITION    :          1633.4  :      84.62  :      61.10
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 66.254
FLOATING-POINT INDEX: 48.553
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.10
C compiler          : gcc version 3.4.3 (csl-sol210-3_4-branch+sol_rpath)
libc                :
MEMORY INDEX        : 24.698
INTEGER INDEX       : 12.236
FLOATING-POINT INDEX: 26.929
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

2.12 Sun/Oracle SPARC T5-2, T5 3.600GHz

# psrinfo -pv

The physical processor has 16 cores and 128 virtual processors (0-127)
  The core has 8 virtual processors (0-7)
  The core has 8 virtual processors (8-15)
  The core has 8 virtual processors (16-23)
  The core has 8 virtual processors (24-31)
  The core has 8 virtual processors (32-39)
  The core has 8 virtual processors (40-47)
  The core has 8 virtual processors (48-55)
  The core has 8 virtual processors (56-63)
  The core has 8 virtual processors (64-71)
  The core has 8 virtual processors (72-79)
  The core has 8 virtual processors (80-87)
  The core has 8 virtual processors (88-95)
  The core has 8 virtual processors (96-103)
  The core has 8 virtual processors (104-111)
  The core has 8 virtual processors (112-119)
  The core has 8 virtual processors (120-127)
    SPARC-T5 (chipid 0, clock 3600 MHz)
The physical processor has 16 cores and 128 virtual processors (128-255)
  The core has 8 virtual processors (128-135)
  The core has 8 virtual processors (136-143)
  The core has 8 virtual processors (144-151)
  The core has 8 virtual processors (152-159)
  The core has 8 virtual processors (160-167)
  The core has 8 virtual processors (168-175)
  The core has 8 virtual processors (176-183)
  The core has 8 virtual processors (184-191)
  The core has 8 virtual processors (192-199)
  The core has 8 virtual processors (200-207)
  The core has 8 virtual processors (208-215)
  The core has 8 virtual processors (216-223)
  The core has 8 virtual processors (224-231)
  The core has 8 virtual processors (232-239)
  The core has 8 virtual processors (240-247)
  The core has 8 virtual processors (248-255)
    SPARC-T5 (chipid 1, clock 3600 MHz)
# ./nbench

BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97)
Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

TEST                : Iterations/sec.  : Old Index   : New Index
                    :                  : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT        :          1098.7  :      28.18  :       9.25
STRING SORT         :          283.28  :     126.58  :      19.59
BITFIELD            :      3.3163e+08  :      56.89  :      11.88
FP EMULATION        :          78.289  :      37.57  :       8.67
FOURIER             :           16855  :      19.17  :      10.77
ASSIGNMENT          :          24.541  :      93.38  :      24.22
IDEA                :          1295.9  :      19.82  :       5.88
HUFFMAN             :          2420.3  :      67.11  :      21.43
NEURAL NET          :          36.632  :      58.85  :      24.75
LU DECOMPOSITION    :          999.96  :      51.80  :      37.41
==========================ORIGINAL BYTEMARK RESULTS==========================
INTEGER INDEX       : 51.391
FLOATING-POINT INDEX: 38.804
Baseline (MSDOS*)   : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
==============================LINUX DATA BELOW===============================
CPU                 :
L2 Cache            :
OS                  : SunOS 5.11
C compiler          :
libc                :
MEMORY INDEX        : 17.799
INTEGER INDEX       : 10.029
FLOATING-POINT INDEX: 21.522
Baseline (LINUX)    : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38

8 comments:

  1. Thanks a lot for all those benchmarks! In fact I've been looking for something like that for some time now since I do have T1 in T2000 and this thing is not good for mu actual compiler development where bootstrap of whole compiler took several hours. I've been curious if for example SPARC64 in M4000 may do better job on compilation. Now it looks like the difference is not that big indeed, but on the other hand still tempting. :-)
    BTW: My T1 is 1 GHz, running with Solaris 11.1, nbench compiled with provided gcc 4.5.2 and I got quite boost on integer performance in comparison with your results:

    BYTEmark* Native Mode Benchmark ver. 2 (10/95)
    Index-split by Andrew D. Balsa (11/97)
    Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

    TEST : Iterations/sec. : Old Index : New Index
    : : Pentium 90* : AMD K6/233*
    --------------------:------------------:-------------:------------
    NUMERIC SORT : 199.28 : 5.11 : 1.68
    STRING SORT : 11.036 : 4.93 : 0.76
    BITFIELD : 5.1961e+07 : 8.91 : 1.86
    FP EMULATION : 56.035 : 26.89 : 6.20
    FOURIER : 1319.9 : 1.50 : 0.84
    ASSIGNMENT : 3.5405 : 13.47 : 3.49
    IDEA : 675.68 : 10.33 : 3.07
    HUFFMAN : 411.28 : 11.40 : 3.64
    NEURAL NET : 0.96862 : 1.56 : 0.65
    LU DECOMPOSITION : 31.162 : 1.61 : 1.17
    ==========================ORIGINAL BYTEMARK RESULTS==========================
    INTEGER INDEX : 9.940
    FLOATING-POINT INDEX: 1.556
    Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
    ==============================LINUX DATA BELOW===============================
    CPU :
    L2 Cache :
    OS : SunOS 5.11
    C compiler :
    libc :
    MEMORY INDEX : 1.706
    INTEGER INDEX : 3.284
    FLOATING-POINT INDEX: 0.863
    Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
    * Trademarks are property of their respective holder.

    ReplyDelete
  2. Hi Vincent,

    Great post, very useful. Do you have numbers for the new SPARC M7?

    Regards,

    ReplyDelete
  3. Hi Ronaldo,
    Nope. I don't have access to SPARC H/W anymore.
    I agree it would be an interesting number.
    Regards,
    Vincent

    ReplyDelete
  4. Thanks Vincent. I'll try to get one T7 box to run nbench and I'll post here the results. It's not going to happen soon though.

    ReplyDelete
  5. Any numbers yet, very keen to know!

    ReplyDelete
  6. Here are the numbers from a T7 with 16 4.1 GHz CPUs. Compiled with gcc 3.4.3, CFLAGS = -s -Wall -O3.

    BYTEmark* Native Mode Benchmark ver. 2 (10/95)
    Index-split by Andrew D. Balsa (11/97)
    Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

    TEST : Iterations/sec. : Old Index : New Index
    : : Pentium 90* : AMD K6/233*
    --------------------:------------------:-------------:------------
    NUMERIC SORT : 1246.9 : 31.98 : 10.50
    STRING SORT : 311.28 : 139.09 : 21.53
    BITFIELD : 3.4642e+08 : 59.42 : 12.41
    FP EMULATION : 104.12 : 49.96 : 11.53
    FOURIER : 17424 : 19.82 : 11.13
    ASSIGNMENT : 26.834 : 102.11 : 26.48
    IDEA : 1471.2 : 22.50 : 6.68
    HUFFMAN : 2751.2 : 76.29 : 24.36
    NEURAL NET : 31.095 : 49.95 : 21.01
    LU DECOMPOSITION : 920.96 : 47.71 : 34.45
    ==========================ORIGINAL BYTEMARK RESULTS==========================
    INTEGER INDEX : 58.391
    FLOATING-POINT INDEX: 36.145
    Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
    ==============================LINUX DATA BELOW===============================
    CPU :
    L2 Cache :
    OS : SunOS 5.10
    C compiler :
    libc :
    MEMORY INDEX : 19.199
    INTEGER INDEX : 11.848
    FLOATING-POINT INDEX: 20.047
    Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
    * Trademarks are property of their respective holder.

    ReplyDelete
  7. Here are the numbers from a T7 with 16 4.1 GHz CPUs. Compiled with gcc 3.4.3, CFLAGS = -s -Wall -O3.

    BYTEmark* Native Mode Benchmark ver. 2 (10/95)
    Index-split by Andrew D. Balsa (11/97)
    Linux/Unix* port by Uwe F. Mayer (12/96,11/97)

    TEST : Iterations/sec. : Old Index : New Index
    : : Pentium 90* : AMD K6/233*
    --------------------:------------------:-------------:------------
    NUMERIC SORT : 1246.9 : 31.98 : 10.50
    STRING SORT : 311.28 : 139.09 : 21.53
    BITFIELD : 3.4642e+08 : 59.42 : 12.41
    FP EMULATION : 104.12 : 49.96 : 11.53
    FOURIER : 17424 : 19.82 : 11.13
    ASSIGNMENT : 26.834 : 102.11 : 26.48
    IDEA : 1471.2 : 22.50 : 6.68
    HUFFMAN : 2751.2 : 76.29 : 24.36
    NEURAL NET : 31.095 : 49.95 : 21.01
    LU DECOMPOSITION : 920.96 : 47.71 : 34.45
    ==========================ORIGINAL BYTEMARK RESULTS==========================
    INTEGER INDEX : 58.391
    FLOATING-POINT INDEX: 36.145
    Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0
    ==============================LINUX DATA BELOW===============================
    CPU :
    L2 Cache :
    OS : SunOS 5.10
    C compiler :
    libc :
    MEMORY INDEX : 19.199
    INTEGER INDEX : 11.848
    FLOATING-POINT INDEX: 20.047
    Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38
    * Trademarks are property of their respective holder.

    ReplyDelete
    Replies
    1. Hi David,
      I find these numbers a little disappointing. Would you mind using the same binary as the one I used before?
      I could attach it here.
      Regards,
      Vincent

      Delete

LVM2 bootdisk encapsulation on RHEL7/Centos7

Introduction Hi everyone, Life on overcloud nodes was simple back then and everybody loved that single 'root' partition on th...