source: trunk/platforms/tsar_generic_xbar/top.cpp @ 1012

Last change on this file since 1012 was 1012, checked in by meunier, 9 years ago
  • Update of simulation scripts for tsar_generic_xbar
File size: 49.0 KB
Line 
1/////////////////////////////////////////////////////////////////////////
2// File: top.cpp
3// Author: Alain Greiner
4// Copyright: UPMC/LIP6
5// Date : may 2013
6// This program is released under the GNU public license
7/////////////////////////////////////////////////////////////////////////
8// This file define a generic TSAR architecture.
9// The physical address space is 40 bits.
10//
11// The number of clusters cannot be larger than 256.
12// The number of processors per cluster cannot be larger than 8.
13//
14// - It uses four dspin_local_crossbar per cluster as local interconnect
15// - It uses two virtual_dspin routers per cluster as global interconnect
16// - It uses the vci_cc_vcache_wrapper
17// - It uses the vci_mem_cache
18// - It contains one vci_xicu per cluster.
19// - It contains one vci_multi_dma per cluster.
20// - It contains one vci_simple_ram per cluster to model the L3 cache.
21//
22// The communication between the MemCache and the Xram is 64 bits.
23//
24// All clusters are identical, but the cluster 0 (called io_cluster),
25// contains 6 extra components:
26// - the boot rom (BROM)
27// - the disk controller (BDEV)
28// - the multi-channel network controller (MNIC)
29// - the multi-channel chained buffer dma controller (CDMA)
30// - the multi-channel tty controller (MTTY)
31// - the frame buffer controller (FBUF)
32//
33// It is build with one single component implementing a cluster,
34// defined in files tsar_xbar_cluster.* (with * = cpp, h, sd)
35//
36// The IRQs are connected to XICUs as follow:
37// - The IRQ_IN[0] to IRQ_IN[7] ports are not used in all clusters.
38// - The DMA IRQs are connected to IRQ_IN[8] to IRQ_IN[15] in all clusters.
39// - The TTY IRQs are connected to IRQ_IN[16] to IRQ_IN[30] in I/O cluster.
40// - The BDEV IRQ is connected to IRQ_IN[31] in I/O cluster.
41//
42// Some hardware parameters are used when compiling the OS, and are used
43// by this top.cpp file. They must be defined in the hard_config.h file :
44// - CLUSTER_X        : number of clusters in a row (power of 2)
45// - CLUSTER_Y        : number of clusters in a column (power of 2)
46// - CLUSTER_SIZE     : size of the segment allocated to a cluster
47// - NB_PROCS_MAX     : number of processors per cluster (power of 2)
48// - NB_DMA_CHANNELS  : number of DMA channels per cluster (< 9)
49// - NB_TTY_CHANNELS  : number of TTY channels in I/O cluster (< 16)
50// - NB_NIC_CHANNELS  : number of NIC channels in I/O cluster (< 9)
51//
52// Some other hardware parameters are not used when compiling the OS,
53// and can be directly defined in this top.cpp file:
54// - XRAM_LATENCY     : external ram latency
55// - MEMC_WAYS        : L2 cache number of ways
56// - MEMC_SETS        : L2 cache number of sets
57// - L1_IWAYS     
58// - L1_ISETS   
59// - L1_DWAYS   
60// - L1_DSETS 
61// - FBUF_X_SIZE      : width of frame buffer (pixels)
62// - FBUF_Y_SIZE      : heigth of frame buffer (lines)
63// - BDEV_SECTOR_SIZE : block size for block drvice
64// - BDEV_IMAGE_NAME  : file pathname for block device
65// - NIC_RX_NAME      : file pathname for NIC received packets
66// - NIC_TX_NAME      : file pathname for NIC transmited packets
67// - NIC_TIMEOUT      : max number of cycles before closing a container
68/////////////////////////////////////////////////////////////////////////
69// General policy for 40 bits physical address decoding:
70// All physical segments base addresses are multiple of 1 Mbytes
71// (=> the 24 LSB bits = 0, and the 16 MSB bits define the target)
72// The (x_width + y_width) MSB bits (left aligned) define
73// the cluster index, and the LADR bits define the local index:
74//      | X_ID  | Y_ID  |---| LADR |     OFFSET          |
75//      |x_width|y_width|---|  8   |       24            |
76/////////////////////////////////////////////////////////////////////////
77// General policy for 14 bits SRCID decoding:
78// Each component is identified by (x_id, y_id, l_id) tuple.
79//      | X_ID  | Y_ID  |---| L_ID |
80//      |x_width|y_width|---|  6   |
81/////////////////////////////////////////////////////////////////////////
82
83#include <systemc>
84#include <sys/time.h>
85#include <iostream>
86#include <sstream>
87#include <cstdlib>
88#include <cstdarg>
89#include <stdint.h>
90
91#include "gdbserver.h"
92#include "mapping_table.h"
93#include "alloc_elems.h"
94#include "tsar_xbar_cluster.h"
95
96#define USE_ALMOS 1
97//#define USE_GIET
98
99#ifdef USE_ALMOS
100#ifdef USE_GIET
101#error "Can't use Two different OS"
102#endif
103#endif
104
105#ifndef USE_ALMOS
106#ifndef USE_GIET
107#error "You need to specify one OS"
108#endif
109#endif
110
111#ifdef USE_ALMOS
112   #define PREFIX_OS "almos/"
113   #include "almos/hard_config.h"
114#endif
115#ifdef USE_GIET
116   #define PREFIX_OS "giet_vm/"
117#endif
118
119///////////////////////////////////////////////////
120//               Parallelisation
121///////////////////////////////////////////////////
122
123
124#if USE_OPENMP
125#include <omp.h>
126#endif
127
128//  nluster index (computed from x,y coordinates)
129#ifdef USE_ALMOS
130   #define cluster(x,y)   (y + x * Y_SIZE)
131#else
132   #define cluster(x,y)   (y + (x << Y_WIDTH))
133#endif
134
135
136#define min(x, y) (x < y ? x : y)
137
138///////////////////////////////////////////////////////////
139//          DSPIN parameters           
140///////////////////////////////////////////////////////////
141
142#define dspin_cmd_width      39
143#define dspin_rsp_width      32
144
145///////////////////////////////////////////////////////////
146//          VCI parameters           
147///////////////////////////////////////////////////////////
148
149#define vci_cell_width_int    4
150#define vci_cell_width_ext    8
151
152#ifdef USE_ALMOS
153#define vci_address_width     32
154#endif
155#ifdef USE_GIET
156#define vci_address_width     40
157#endif
158#define vci_plen_width        8
159#define vci_rerror_width      1
160#define vci_clen_width        1
161#define vci_rflag_width       1
162#define vci_srcid_width       14
163#define vci_pktid_width       4
164#define vci_trdid_width       4
165#define vci_wrplen_width      1
166
167////////////////////////////////////////////////////////////
168//    Secondary Hardware Parameters         
169//////////////////////i/////////////////////////////////////
170
171
172#define XRAM_LATENCY          0
173
174#define MEMC_WAYS             16
175#define MEMC_SETS             256
176
177#define L1_IWAYS              4
178#define L1_ISETS              64
179
180#define L1_DWAYS              4
181#define L1_DSETS              64
182
183#ifdef USE_ALMOS
184#define FBUF_X_SIZE           1024
185#define FBUF_Y_SIZE           1024
186#endif
187#ifdef USE_GIET
188#define FBUF_X_SIZE           128
189#define FBUF_Y_SIZE           128
190#endif
191
192#ifdef USE_GIET
193#define BDEV_SECTOR_SIZE      512
194#define BDEV_IMAGE_NAME       PREFIX_OS"display/images.raw"
195#endif
196#ifdef USE_ALMOS
197#define BDEV_SECTOR_SIZE      4096
198#define BDEV_IMAGE_NAME       PREFIX_OS"hdd-img.bin"
199#endif
200
201#define NIC_RX_NAME           PREFIX_OS"nic/rx_packets.txt"
202#define NIC_TX_NAME           PREFIX_OS"nic/tx_packets.txt"
203#define NIC_TIMEOUT           10000
204
205#define NORTH                 0
206#define SOUTH                 1
207#define EAST                  2
208#define WEST                  3
209
210////////////////////////////////////////////////////////////
211//    Software to be loaded in ROM & RAM         
212//////////////////////i/////////////////////////////////////
213
214#ifdef USE_ALMOS
215#define soft_name       PREFIX_OS"preloader.elf"
216#endif
217#ifdef USE_GIET
218#define soft_pathname   PREFIX_OS"soft.elf"
219#endif
220
221////////////////////////////////////////////////////////////
222//     DEBUG Parameters default values         
223//////////////////////i/////////////////////////////////////
224
225#define MAX_FROZEN_CYCLES     100000000
226
227
228////////////////////////////////////////////////////////////////////
229//     TGTID definition in direct space
230// For all components:  global TGTID = global SRCID = cluster_index
231////////////////////////////////////////////////////////////////////
232
233
234/////////////////////////////////////////////////////////
235//    Physical segments definition
236/////////////////////////////////////////////////////////
237// There is 3 segments replicated in all clusters
238// and 5 specific segments in the "IO" cluster
239// (containing address 0xBF000000)
240/////////////////////////////////////////////////////////
241
242#ifdef USE_GIET
243   #error "This platform is no more supported for the GIET"
244#endif
245
246#ifdef USE_ALMOS
247   // 2^19 is the offset for the local id (8 bits for global ID :
248   // 1 bit for Memcache or Peripheral, 4 for local peripheral id)
249   // (Almos supports 32 bits physical addresses)
250#endif
251
252bool stop_called = false;
253
254/////////////////////////////////
255int _main(int argc, char *argv[])
256{
257   using namespace sc_core;
258   using namespace soclib::caba;
259   using namespace soclib::common;
260
261   const int64_t max_cycles   = 5000000;             // Maximum number of cycles simulated in one sc_start call
262   int64_t ncycles            = 0x7FFFFFFFFFFFFFFF;  // simulated cycles
263   char     disk_name[256]    = BDEV_IMAGE_NAME;    // pathname to the disk image
264   char     nic_rx_name[256]  = NIC_RX_NAME;        // pathname to the rx packets file
265   char     nic_tx_name[256]  = NIC_TX_NAME;        // pathname to the tx packets file
266   ssize_t  threads_nr        = 1;                  // simulator's threads number
267   bool     debug_ok          = false;              // trace activated
268   size_t   debug_period      = 1;                  // trace period
269   size_t   debug_memc_id     = 0;                  // index of memc to be traced
270   size_t   debug_proc_id     = 0;                  // index of proc to be traced
271   int64_t  debug_from        = 0;                  // trace start cycle
272   int64_t  frozen_cycles     = MAX_FROZEN_CYCLES;  // monitoring frozen processor
273   size_t   cluster_io_id;                         // index of cluster containing IOs
274   int64_t  reset_counters    = -1;
275   int64_t  dump_counters     = -1;
276   bool     do_reset_counters = false;
277   bool     do_dump_counters  = false;
278   struct   timeval t1, t2;
279   uint64_t ms1, ms2;
280
281   ////////////// command line arguments //////////////////////
282   if (argc > 1)
283   {
284      for (int n = 1; n < argc; n = n + 2)
285      {
286         if ((strcmp(argv[n], "-NCYCLES") == 0) && (n + 1 < argc))
287         {
288            ncycles = (int64_t) strtol(argv[n + 1], NULL, 0);
289         }
290         else if ((strcmp(argv[n], "-SOFT") == 0) && (n + 1 < argc))
291         {
292#ifdef USE_ALMOS
293            assert( 0 && "Can't define almos soft name" );
294#endif
295#ifdef USE_GIET
296            strcpy(soft_name, argv[n + 1]);
297#endif
298         }
299         else if ((strcmp(argv[n],"-DISK") == 0) && (n + 1 < argc))
300         {
301            strcpy(disk_name, argv[n + 1]);
302         }
303         else if ((strcmp(argv[n],"-DEBUG") == 0) && (n + 1 < argc))
304         {
305            debug_ok = true;
306            debug_from = (int64_t) strtol(argv[n + 1], NULL, 0);
307         }
308         else if ((strcmp(argv[n], "-MEMCID") == 0) && (n + 1 < argc))
309         {
310            debug_memc_id = (size_t) strtol(argv[n + 1], NULL, 0);
311#ifdef USE_ALMOS
312            assert((debug_memc_id < (X_SIZE * Y_SIZE)) &&
313                   "debug_memc_id larger than X_SIZE * Y_SIZE" );
314#else
315            size_t x = debug_memc_id >> Y_WIDTH;
316            size_t y = debug_memc_id & ((1 << Y_WIDTH) - 1);
317
318            assert( (x <= X_SIZE) and (y <= Y_SIZE) &&
319                  "MEMCID parameter refers a not valid memory cache");
320#endif
321         }
322         else if ((strcmp(argv[n], "-PROCID") == 0) && (n + 1 < argc))
323         {
324            debug_proc_id = (size_t) strtol(argv[n + 1], NULL, 0);
325#ifdef USE_ALMOS
326            assert((debug_proc_id < (X_SIZE * Y_SIZE * NB_PROCS_MAX)) && 
327                   "debug_proc_id larger than X_SIZE * Y_SIZE * NB_PROCS");
328#else
329            size_t cluster_xy = debug_proc_id / NB_PROCS_MAX ;
330            size_t x = cluster_xy >> Y_WIDTH;
331            size_t y = cluster_xy & ((1 << Y_WIDTH) - 1);
332
333            assert( (x <= X_SIZE) and (y <= Y_SIZE) &&
334                  "PROCID parameter refers a not valid processor");
335#endif
336         }
337         else if ((strcmp(argv[n], "-THREADS") == 0) && ((n + 1) < argc))
338         {
339            threads_nr = (ssize_t) strtol(argv[n + 1], NULL, 0);
340            threads_nr = (threads_nr < 1) ? 1 : threads_nr;
341         }
342         else if ((strcmp(argv[n], "-FROZEN") == 0) && (n + 1 < argc))
343         {
344            frozen_cycles = (int64_t) strtol(argv[n + 1], NULL, 0);
345         }
346         else if ((strcmp(argv[n], "-PERIOD") == 0) && (n + 1 < argc))
347         {
348            debug_period = (size_t) strtol(argv[n + 1], NULL, 0);
349         }
350         else if ((strcmp(argv[n], "--reset-counters") == 0) && (n + 1 < argc))
351         {
352            reset_counters = (int64_t) strtol(argv[n + 1], NULL, 0);
353            do_reset_counters = true;
354         }
355         else if ((strcmp(argv[n], "--dump-counters") == 0) && (n + 1 < argc))
356         {
357            dump_counters = (int64_t) strtol(argv[n + 1], NULL, 0);
358            do_dump_counters = true;
359         }
360         else
361         {
362            std::cout << "   Arguments are (key,value) couples." << std::endl;
363            std::cout << "   The order is not important." << std::endl;
364            std::cout << "   Accepted arguments are :" << std::endl << std::endl;
365            std::cout << "     -SOFT pathname_for_embedded_soft" << std::endl;
366            std::cout << "     -DISK pathname_for_disk_image" << std::endl;
367            std::cout << "     -NCYCLES number_of_simulated_cycles" << std::endl;
368            std::cout << "     -DEBUG debug_start_cycle" << std::endl;
369            std::cout << "     -THREADS simulator's threads number" << std::endl;
370            std::cout << "     -FROZEN max_number_of_lines" << std::endl;
371            std::cout << "     -PERIOD number_of_cycles between trace" << std::endl;
372            std::cout << "     -MEMCID index_memc_to_be_traced" << std::endl;
373            std::cout << "     -PROCID index_proc_to_be_traced" << std::endl;
374            exit(0);
375         }
376      }
377   }
378
379    // checking hardware parameters
380    assert( ( (X_SIZE == 1) or (X_SIZE == 2) or (X_SIZE == 4) or
381              (X_SIZE == 8) or (X_SIZE == 16) ) and
382              "The X_SIZE parameter must be 1, 2, 4, 8 or 16" );
383
384    assert( ( (Y_SIZE == 1) or (Y_SIZE == 2) or (Y_SIZE == 4) or
385              (Y_SIZE == 8) or (Y_SIZE == 16) ) and
386              "The Y_SIZE parameter must be 1, 2, 4, 8 or 16" );
387
388    assert( ( (NB_PROCS_MAX == 1) or (NB_PROCS_MAX == 2) or
389              (NB_PROCS_MAX == 4) or (NB_PROCS_MAX == 8) ) and
390             "The NB_PROCS_MAX parameter must be 1, 2, 4 or 8" );
391
392    assert( (NB_DMA_CHANNELS < 9) and
393            "The NB_DMA_CHANNELS parameter must be smaller than 9" );
394
395    assert( (NB_TTY_CHANNELS < 15) and
396            "The NB_TTY_CHANNELS parameter must be smaller than 15" );
397
398    assert( (NB_NIC_CHANNELS < 9) and
399            "The NB_NIC_CHANNELS parameter must be smaller than 9" );
400
401#ifdef USE_GIET
402    assert( (vci_address_width == 40) and
403            "VCI address width with the GIET must be 40 bits" );
404#endif
405
406#ifdef USE_ALMOS
407    assert( (vci_address_width == 32) and
408            "VCI address width with ALMOS must be 32 bits" );
409#endif
410
411
412    std::cout << std::endl;
413    std::cout << " - X_SIZE             = " << X_SIZE << std::endl;
414    std::cout << " - Y_SIZE             = " << Y_SIZE << std::endl;
415    std::cout << " - NB_PROCS_MAX     = " << NB_PROCS_MAX <<  std::endl;
416    std::cout << " - NB_DMA_CHANNELS  = " << NB_DMA_CHANNELS <<  std::endl;
417    std::cout << " - NB_TTY_CHANNELS  = " << NB_TTY_CHANNELS <<  std::endl;
418    std::cout << " - NB_NIC_CHANNELS  = " << NB_NIC_CHANNELS <<  std::endl;
419    std::cout << " - MEMC_WAYS        = " << MEMC_WAYS << std::endl;
420    std::cout << " - MEMC_SETS        = " << MEMC_SETS << std::endl;
421    std::cout << " - RAM_LATENCY      = " << XRAM_LATENCY << std::endl;
422    std::cout << " - MAX_FROZEN       = " << frozen_cycles << std::endl;
423
424    std::cout << std::endl;
425    // Internal and External VCI parameters definition
426    typedef soclib::caba::VciParams<vci_cell_width_int,
427                                    vci_plen_width,
428                                    vci_address_width,
429                                    vci_rerror_width,
430                                    vci_clen_width,
431                                    vci_rflag_width,
432                                    vci_srcid_width,
433                                    vci_pktid_width,
434                                    vci_trdid_width,
435                                    vci_wrplen_width> vci_param_int;
436
437    typedef soclib::caba::VciParams<vci_cell_width_ext,
438                                    vci_plen_width,
439                                    vci_address_width,
440                                    vci_rerror_width,
441                                    vci_clen_width,
442                                    vci_rflag_width,
443                                    vci_srcid_width,
444                                    vci_pktid_width,
445                                    vci_trdid_width,
446                                    vci_wrplen_width> vci_param_ext;
447
448#if USE_OPENMP
449   omp_set_dynamic(false);
450   omp_set_num_threads(threads_nr);
451   std::cerr << "Built with openmp version " << _OPENMP << std::endl;
452#endif
453
454   // Define parameters depending on mesh size
455   size_t   x_width;
456   size_t   y_width;
457
458#ifdef USE_ALMOS
459   if      (X_SIZE == 1) x_width = 0;
460   else if (X_SIZE == 2) x_width = 1;
461   else if (X_SIZE <= 4) x_width = 2;
462   else if (X_SIZE <= 8) x_width = 3;
463   else                x_width = 4;
464
465   if      (Y_SIZE == 1) y_width = 0;
466   else if (Y_SIZE == 2) y_width = 1;
467   else if (Y_SIZE <= 4) y_width = 2;
468   else if (Y_SIZE <= 8) y_width = 3;
469   else                y_width = 4;
470
471#else
472   size_t x_width = X_WIDTH;
473   size_t y_width = Y_WIDTH;
474
475   assert((X_WIDTH <= 4) and (Y_WIDTH <= 4) and
476           "Up to 256 clusters");
477
478   assert((X_SIZE <= (1 << X_WIDTH)) and (Y_SIZE <= (1 << Y_WIDTH)) and
479           "The X_WIDTH and Y_WIDTH parameter are insufficient");
480
481#endif
482
483   // index of cluster containing IOs
484   cluster_io_id = 0x00bfc00000ULL >> (vci_address_width - x_width - y_width);
485
486
487   /////////////////////
488   //  Mapping Tables
489   /////////////////////
490
491   // internal network
492   MappingTable maptabd(vci_address_width, 
493                        IntTab(x_width + y_width, 16 - x_width - y_width), 
494                        IntTab(x_width + y_width, vci_srcid_width - x_width - y_width), 
495                        0x00FF800000);
496
497   for (size_t x = 0; x < X_SIZE; x++)
498   {
499      for (size_t y = 0; y < Y_SIZE; y++)
500      {
501         sc_uint<vci_address_width> offset;
502         offset = (sc_uint<vci_address_width>) cluster(x,y) 
503                   << (vci_address_width - x_width - y_width);
504
505         std::ostringstream    si;
506         si << "seg_xicu_" << x << "_" << y;
507         maptabd.add(Segment(si.str(), SEG_XCU_BASE + offset, SEG_XCU_SIZE, 
508                  IntTab(cluster(x,y), XCU_TGTID), false));
509
510         std::ostringstream    sd;
511         sd << "seg_mdma_" << x << "_" << y;
512         maptabd.add(Segment(sd.str(), SEG_DMA_BASE + offset, SEG_DMA_SIZE, 
513                  IntTab(cluster(x,y), DMA_TGTID), false));
514
515         std::ostringstream    sh;
516         sh << "seg_memc_" << x << "_" << y;
517         maptabd.add(Segment(sh.str(), SEG_RAM_BASE + offset, SEG_RAM_SIZE, 
518                  IntTab(cluster(x,y), RAM_TGTID), true));
519
520         if ( cluster(x,y) == cluster_io_id )
521         {
522            maptabd.add(Segment("seg_mtty", SEG_TTY_BASE, SEG_TTY_SIZE, 
523                        IntTab(cluster(x,y),TTY_TGTID), false));
524            maptabd.add(Segment("seg_fbuf", SEG_FBF_BASE, SEG_FBF_SIZE, 
525                        IntTab(cluster(x,y),FBF_TGTID), false));
526            maptabd.add(Segment("seg_bdev", SEG_IOC_BASE, SEG_IOC_SIZE, 
527                        IntTab(cluster(x,y),IOC_TGTID), false));
528            maptabd.add(Segment("seg_brom", SEG_ROM_BASE, SEG_ROM_SIZE, 
529                        IntTab(cluster(x,y),ROM_TGTID), true));
530            maptabd.add(Segment("seg_mnic", SEG_NIC_BASE, SEG_NIC_SIZE, 
531                        IntTab(cluster(x,y),NIC_TGTID), false));
532            maptabd.add(Segment("seg_cdma", SEG_CMA_BASE, SEG_CMA_SIZE, 
533                        IntTab(cluster(x,y),CMA_TGTID), false));
534            maptabd.add(Segment("seg_simh", SEG_SIM_BASE, SEG_SIM_SIZE, 
535                        IntTab(cluster(x,y),SIM_TGTID), false));
536         }
537      }
538   }
539   std::cout << maptabd << std::endl;
540
541   // external network
542   MappingTable maptabx(vci_address_width, 
543                        IntTab(x_width + y_width), 
544                        IntTab(x_width + y_width), 
545                        0xFFFF000000ULL);
546
547   for (size_t x = 0; x < X_SIZE; x++)
548   {
549      for (size_t y = 0; y < Y_SIZE ; y++)
550      {
551
552         sc_uint<vci_address_width> offset;
553         offset = (sc_uint<vci_address_width>) cluster(x,y) 
554                   << (vci_address_width - x_width - y_width);
555
556         std::ostringstream sh;
557         sh << "x_seg_memc_" << x << "_" << y;
558
559         maptabx.add(Segment(sh.str(), SEG_RAM_BASE + offset, 
560                     SEG_RAM_SIZE, IntTab(cluster(x,y)), false));
561      }
562   }
563   std::cout << maptabx << std::endl;
564
565   ////////////////////
566   // Signals
567   ///////////////////
568
569   sc_clock           signal_clk("clk");
570   sc_signal<bool>    signal_resetn("resetn");
571
572   // Horizontal inter-clusters DSPIN signals
573   DspinSignals<dspin_cmd_width>** signal_dspin_h_cmd_inc =
574      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_h_cmd_inc", X_SIZE - 1, Y_SIZE);
575   DspinSignals<dspin_cmd_width>** signal_dspin_h_cmd_dec =
576      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_h_cmd_dec", X_SIZE - 1, Y_SIZE);
577
578   DspinSignals<dspin_rsp_width>** signal_dspin_h_rsp_inc =
579      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_h_rsp_inc", X_SIZE - 1, Y_SIZE);
580   DspinSignals<dspin_rsp_width>** signal_dspin_h_rsp_dec =
581      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_h_rsp_dec", X_SIZE - 1, Y_SIZE);
582
583   DspinSignals<dspin_cmd_width>** signal_dspin_h_m2p_inc =
584      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_h_m2p_inc", X_SIZE- 1 , Y_SIZE);
585   DspinSignals<dspin_cmd_width>** signal_dspin_h_m2p_dec =
586      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_h_m2p_dec", X_SIZE - 1, Y_SIZE);
587
588   DspinSignals<dspin_rsp_width>** signal_dspin_h_p2m_inc =
589      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_h_p2m_inc", X_SIZE - 1, Y_SIZE);
590   DspinSignals<dspin_rsp_width>** signal_dspin_h_p2m_dec =
591      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_h_p2m_dec", X_SIZE - 1, Y_SIZE);
592
593   DspinSignals<dspin_cmd_width>** signal_dspin_h_cla_inc =
594      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_h_cla_inc", X_SIZE - 1, Y_SIZE);
595   DspinSignals<dspin_cmd_width>** signal_dspin_h_cla_dec =
596      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_h_cla_dec", X_SIZE - 1, Y_SIZE);
597
598   // Vertical inter-clusters DSPIN signals
599   DspinSignals<dspin_cmd_width>** signal_dspin_v_cmd_inc =
600      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_v_cmd_inc", X_SIZE, Y_SIZE - 1);
601   DspinSignals<dspin_cmd_width>** signal_dspin_v_cmd_dec =
602      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_v_cmd_dec", X_SIZE, Y_SIZE - 1);
603
604   DspinSignals<dspin_rsp_width>** signal_dspin_v_rsp_inc =
605      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_v_rsp_inc", X_SIZE, Y_SIZE - 1);
606   DspinSignals<dspin_rsp_width>** signal_dspin_v_rsp_dec =
607      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_v_rsp_dec", X_SIZE, Y_SIZE - 1);
608
609   DspinSignals<dspin_cmd_width>** signal_dspin_v_m2p_inc =
610      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_v_m2p_inc", X_SIZE, Y_SIZE - 1);
611   DspinSignals<dspin_cmd_width>** signal_dspin_v_m2p_dec =
612      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_v_m2p_dec", X_SIZE, Y_SIZE - 1);
613
614   DspinSignals<dspin_rsp_width>** signal_dspin_v_p2m_inc =
615      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_v_p2m_inc", X_SIZE, Y_SIZE - 1);
616   DspinSignals<dspin_rsp_width>** signal_dspin_v_p2m_dec =
617      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_v_p2m_dec", X_SIZE, Y_SIZE - 1);
618
619   DspinSignals<dspin_cmd_width>** signal_dspin_v_cla_inc =
620      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_v_cla_inc", X_SIZE, Y_SIZE - 1);
621   DspinSignals<dspin_cmd_width>** signal_dspin_v_cla_dec =
622      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_v_cla_dec", X_SIZE, Y_SIZE - 1);
623
624   // Mesh boundaries DSPIN signals (Most of those signals are not used...)
625   DspinSignals<dspin_cmd_width>*** signal_dspin_bound_cmd_in =
626      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_bound_cmd_in" , X_SIZE, Y_SIZE, 4);
627   DspinSignals<dspin_cmd_width>*** signal_dspin_bound_cmd_out =
628      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_bound_cmd_out", X_SIZE, Y_SIZE, 4);
629
630   DspinSignals<dspin_rsp_width>*** signal_dspin_bound_rsp_in =
631      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_bound_rsp_in" , X_SIZE, Y_SIZE, 4);
632   DspinSignals<dspin_rsp_width>*** signal_dspin_bound_rsp_out =
633      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_bound_rsp_out", X_SIZE, Y_SIZE, 4);
634
635   DspinSignals<dspin_cmd_width>*** signal_dspin_bound_m2p_in =
636      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_bound_m2p_in" , X_SIZE, Y_SIZE, 4);
637   DspinSignals<dspin_cmd_width>*** signal_dspin_bound_m2p_out =
638      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_bound_m2p_out", X_SIZE, Y_SIZE, 4);
639
640   DspinSignals<dspin_rsp_width>*** signal_dspin_bound_p2m_in =
641      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_bound_p2m_in" , X_SIZE, Y_SIZE, 4);
642   DspinSignals<dspin_rsp_width>*** signal_dspin_bound_p2m_out =
643      alloc_elems<DspinSignals<dspin_rsp_width> >("signal_dspin_bound_p2m_out", X_SIZE, Y_SIZE, 4);
644
645   DspinSignals<dspin_cmd_width>*** signal_dspin_bound_cla_in =
646      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_bound_cla_in" , X_SIZE, Y_SIZE, 4);
647   DspinSignals<dspin_cmd_width>*** signal_dspin_bound_cla_out =
648      alloc_elems<DspinSignals<dspin_cmd_width> >("signal_dspin_bound_cla_out", X_SIZE, Y_SIZE, 4);
649
650
651   ////////////////////////////
652   //      Loader   
653   ////////////////////////////
654
655   soclib::common::Loader loader(soft_name);
656
657   typedef soclib::common::GdbServer<soclib::common::Mips32ElIss> proc_iss;
658   proc_iss::set_loader(loader);
659
660   ////////////////////////////
661   // Clusters construction
662   ////////////////////////////
663
664   TsarXbarCluster<dspin_cmd_width,
665                   dspin_rsp_width,
666                   vci_param_int,
667                   vci_param_ext> * clusters[X_SIZE][Y_SIZE];
668
669#if USE_OPENMP
670#pragma omp parallel
671    {
672#pragma omp for
673#endif
674        for (size_t i = 0; i  < (X_SIZE * Y_SIZE); i++)
675        {
676            size_t x = i / Y_SIZE;
677            size_t y = i % Y_SIZE;
678
679#if USE_OPENMP
680#pragma omp critical
681            {
682#endif
683            std::cout << std::endl;
684            std::cout << "Cluster_" << x << "_" << y << std::endl;
685            std::cout << std::endl;
686
687            std::ostringstream sc;
688            sc << "cluster_" << x << "_" << y;
689            clusters[x][y] = new TsarXbarCluster<dspin_cmd_width,
690                                                 dspin_rsp_width,
691                                                 vci_param_int,
692                                                 vci_param_ext>
693            (
694                sc.str().c_str(),
695                NB_PROCS_MAX,
696                NB_TTY_CHANNELS,
697                NB_DMA_CHANNELS,
698                x,
699                y,
700                cluster(x,y),
701                maptabd,
702                maptabx,
703                x_width,
704                y_width,
705                vci_srcid_width - x_width - y_width,   // l_id width,
706                RAM_TGTID,
707                XCU_TGTID,
708                DMA_TGTID,
709                FBF_TGTID,
710                TTY_TGTID,
711                ROM_TGTID,
712                NIC_TGTID,
713                CMA_TGTID,
714                IOC_TGTID,
715                SIM_TGTID,
716                MEMC_WAYS,
717                MEMC_SETS,
718                L1_IWAYS,
719                L1_ISETS,
720                L1_DWAYS,
721                L1_DSETS,
722                IRQ_PER_PROCESSOR,
723                XRAM_LATENCY,
724                (cluster(x,y) == cluster_io_id),
725                FBF_X_SIZE,
726                FBF_Y_SIZE,
727                disk_name,
728                BDEV_SECTOR_SIZE,
729                NB_NIC_CHANNELS,
730                nic_rx_name,
731                nic_tx_name,
732                NIC_TIMEOUT,
733                NB_CMA_CHANNELS,
734                loader,
735                frozen_cycles,
736                debug_from,
737                debug_ok,
738                debug_ok
739            );
740
741#if USE_OPENMP
742            } // end critical
743#endif
744        } // end for
745#if USE_OPENMP
746    }
747#endif
748
749   ///////////////////////////////////////////////////////////////
750   //     Net-list
751   ///////////////////////////////////////////////////////////////
752
753   // Clock & RESET
754   for (size_t x = 0; x < (X_SIZE); x++){
755      for (size_t y = 0; y < Y_SIZE; y++){
756         clusters[x][y]->p_clk                         (signal_clk);
757         clusters[x][y]->p_resetn                      (signal_resetn);
758      }
759   }
760
761   // Inter Clusters horizontal connections
762   if (X_SIZE > 1) {
763       for (size_t x = 0; x < (X_SIZE-1); x++) {
764           for (size_t y = 0; y < (Y_SIZE); y++) {
765               clusters[x][y]->p_cmd_out[EAST]      (signal_dspin_h_cmd_inc[x][y]);
766               clusters[x+1][y]->p_cmd_in[WEST]     (signal_dspin_h_cmd_inc[x][y]);
767               clusters[x][y]->p_cmd_in[EAST]       (signal_dspin_h_cmd_dec[x][y]);
768               clusters[x+1][y]->p_cmd_out[WEST]    (signal_dspin_h_cmd_dec[x][y]);
769
770               clusters[x][y]->p_rsp_out[EAST]      (signal_dspin_h_rsp_inc[x][y]);
771               clusters[x+1][y]->p_rsp_in[WEST]     (signal_dspin_h_rsp_inc[x][y]);
772               clusters[x][y]->p_rsp_in[EAST]       (signal_dspin_h_rsp_dec[x][y]);
773               clusters[x+1][y]->p_rsp_out[WEST]    (signal_dspin_h_rsp_dec[x][y]);
774
775               clusters[x][y]->p_m2p_out[EAST]      (signal_dspin_h_m2p_inc[x][y]);
776               clusters[x+1][y]->p_m2p_in[WEST]     (signal_dspin_h_m2p_inc[x][y]);
777               clusters[x][y]->p_m2p_in[EAST]       (signal_dspin_h_m2p_dec[x][y]);
778               clusters[x+1][y]->p_m2p_out[WEST]    (signal_dspin_h_m2p_dec[x][y]);
779
780               clusters[x][y]->p_p2m_out[EAST]      (signal_dspin_h_p2m_inc[x][y]);
781               clusters[x+1][y]->p_p2m_in[WEST]     (signal_dspin_h_p2m_inc[x][y]);
782               clusters[x][y]->p_p2m_in[EAST]       (signal_dspin_h_p2m_dec[x][y]);
783               clusters[x+1][y]->p_p2m_out[WEST]    (signal_dspin_h_p2m_dec[x][y]);
784
785               clusters[x][y]->p_cla_out[EAST]      (signal_dspin_h_cla_inc[x][y]);
786               clusters[x+1][y]->p_cla_in[WEST]     (signal_dspin_h_cla_inc[x][y]);
787               clusters[x][y]->p_cla_in[EAST]       (signal_dspin_h_cla_dec[x][y]);
788               clusters[x+1][y]->p_cla_out[WEST]    (signal_dspin_h_cla_dec[x][y]);
789           }
790       }
791   }
792   std::cout << std::endl << "Horizontal connections done" << std::endl;
793
794   // Inter Clusters vertical connections
795   if (Y_SIZE > 1) {
796       for (size_t y = 0; y < (Y_SIZE-1); y++) {
797           for (size_t x = 0; x < X_SIZE; x++) {
798               clusters[x][y]->p_cmd_out[NORTH]     (signal_dspin_v_cmd_inc[x][y]);
799               clusters[x][y+1]->p_cmd_in[SOUTH]    (signal_dspin_v_cmd_inc[x][y]);
800               clusters[x][y]->p_cmd_in[NORTH]      (signal_dspin_v_cmd_dec[x][y]);
801               clusters[x][y+1]->p_cmd_out[SOUTH]   (signal_dspin_v_cmd_dec[x][y]);
802
803               clusters[x][y]->p_rsp_out[NORTH]     (signal_dspin_v_rsp_inc[x][y]);
804               clusters[x][y+1]->p_rsp_in[SOUTH]    (signal_dspin_v_rsp_inc[x][y]);
805               clusters[x][y]->p_rsp_in[NORTH]      (signal_dspin_v_rsp_dec[x][y]);
806               clusters[x][y+1]->p_rsp_out[SOUTH]   (signal_dspin_v_rsp_dec[x][y]);
807
808               clusters[x][y]->p_m2p_out[NORTH]     (signal_dspin_v_m2p_inc[x][y]);
809               clusters[x][y+1]->p_m2p_in[SOUTH]    (signal_dspin_v_m2p_inc[x][y]);
810               clusters[x][y]->p_m2p_in[NORTH]      (signal_dspin_v_m2p_dec[x][y]);
811               clusters[x][y+1]->p_m2p_out[SOUTH]   (signal_dspin_v_m2p_dec[x][y]);
812
813               clusters[x][y]->p_p2m_out[NORTH]     (signal_dspin_v_p2m_inc[x][y]);
814               clusters[x][y+1]->p_p2m_in[SOUTH]    (signal_dspin_v_p2m_inc[x][y]);
815               clusters[x][y]->p_p2m_in[NORTH]      (signal_dspin_v_p2m_dec[x][y]);
816               clusters[x][y+1]->p_p2m_out[SOUTH]   (signal_dspin_v_p2m_dec[x][y]);
817
818               clusters[x][y]->p_cla_out[NORTH]     (signal_dspin_v_cla_inc[x][y]);
819               clusters[x][y+1]->p_cla_in[SOUTH]    (signal_dspin_v_cla_inc[x][y]);
820               clusters[x][y]->p_cla_in[NORTH]      (signal_dspin_v_cla_dec[x][y]);
821               clusters[x][y+1]->p_cla_out[SOUTH]   (signal_dspin_v_cla_dec[x][y]);
822           }
823       }
824   }
825   std::cout << std::endl << "Vertical connections done" << std::endl;
826
827   // East & West boundary cluster connections
828   for (size_t y = 0; y < (Y_SIZE); y++) {
829       clusters[0][y]->p_cmd_in[WEST]           (signal_dspin_bound_cmd_in[0][y][WEST]);
830       clusters[0][y]->p_cmd_out[WEST]          (signal_dspin_bound_cmd_out[0][y][WEST]);
831       clusters[X_SIZE-1][y]->p_cmd_in[EAST]    (signal_dspin_bound_cmd_in[X_SIZE-1][y][EAST]);
832       clusters[X_SIZE-1][y]->p_cmd_out[EAST]   (signal_dspin_bound_cmd_out[X_SIZE-1][y][EAST]);
833
834       clusters[0][y]->p_rsp_in[WEST]           (signal_dspin_bound_rsp_in[0][y][WEST]);
835       clusters[0][y]->p_rsp_out[WEST]          (signal_dspin_bound_rsp_out[0][y][WEST]);
836       clusters[X_SIZE-1][y]->p_rsp_in[EAST]    (signal_dspin_bound_rsp_in[X_SIZE-1][y][EAST]);
837       clusters[X_SIZE-1][y]->p_rsp_out[EAST]   (signal_dspin_bound_rsp_out[X_SIZE-1][y][EAST]);
838
839       clusters[0][y]->p_m2p_in[WEST]           (signal_dspin_bound_m2p_in[0][y][WEST]);
840       clusters[0][y]->p_m2p_out[WEST]          (signal_dspin_bound_m2p_out[0][y][WEST]);
841       clusters[X_SIZE-1][y]->p_m2p_in[EAST]    (signal_dspin_bound_m2p_in[X_SIZE-1][y][EAST]);
842       clusters[X_SIZE-1][y]->p_m2p_out[EAST]   (signal_dspin_bound_m2p_out[X_SIZE-1][y][EAST]);
843
844       clusters[0][y]->p_p2m_in[WEST]           (signal_dspin_bound_p2m_in[0][y][WEST]);
845       clusters[0][y]->p_p2m_out[WEST]          (signal_dspin_bound_p2m_out[0][y][WEST]);
846       clusters[X_SIZE-1][y]->p_p2m_in[EAST]    (signal_dspin_bound_p2m_in[X_SIZE-1][y][EAST]);
847       clusters[X_SIZE-1][y]->p_p2m_out[EAST]   (signal_dspin_bound_p2m_out[X_SIZE-1][y][EAST]);
848
849       clusters[0][y]->p_cla_in[WEST]           (signal_dspin_bound_cla_in[0][y][WEST]);
850       clusters[0][y]->p_cla_out[WEST]          (signal_dspin_bound_cla_out[0][y][WEST]);
851       clusters[X_SIZE-1][y]->p_cla_in[EAST]    (signal_dspin_bound_cla_in[X_SIZE-1][y][EAST]);
852       clusters[X_SIZE-1][y]->p_cla_out[EAST]   (signal_dspin_bound_cla_out[X_SIZE-1][y][EAST]);
853   }
854
855   std::cout << std::endl << "West & East boundaries connections done" << std::endl;
856
857   // North & South boundary clusters connections
858   for (size_t x = 0; x < X_SIZE; x++) {
859       clusters[x][0]->p_cmd_in[SOUTH]          (signal_dspin_bound_cmd_in[x][0][SOUTH]);
860       clusters[x][0]->p_cmd_out[SOUTH]         (signal_dspin_bound_cmd_out[x][0][SOUTH]);
861       clusters[x][Y_SIZE-1]->p_cmd_in[NORTH]   (signal_dspin_bound_cmd_in[x][Y_SIZE-1][NORTH]);
862       clusters[x][Y_SIZE-1]->p_cmd_out[NORTH]  (signal_dspin_bound_cmd_out[x][Y_SIZE-1][NORTH]);
863
864       clusters[x][0]->p_rsp_in[SOUTH]          (signal_dspin_bound_rsp_in[x][0][SOUTH]);
865       clusters[x][0]->p_rsp_out[SOUTH]         (signal_dspin_bound_rsp_out[x][0][SOUTH]);
866       clusters[x][Y_SIZE-1]->p_rsp_in[NORTH]   (signal_dspin_bound_rsp_in[x][Y_SIZE-1][NORTH]);
867       clusters[x][Y_SIZE-1]->p_rsp_out[NORTH]  (signal_dspin_bound_rsp_out[x][Y_SIZE-1][NORTH]);
868
869       clusters[x][0]->p_m2p_in[SOUTH]          (signal_dspin_bound_m2p_in[x][0][SOUTH]);
870       clusters[x][0]->p_m2p_out[SOUTH]         (signal_dspin_bound_m2p_out[x][0][SOUTH]);
871       clusters[x][Y_SIZE-1]->p_m2p_in[NORTH]   (signal_dspin_bound_m2p_in[x][Y_SIZE-1][NORTH]);
872       clusters[x][Y_SIZE-1]->p_m2p_out[NORTH]  (signal_dspin_bound_m2p_out[x][Y_SIZE-1][NORTH]);
873
874       clusters[x][0]->p_p2m_in[SOUTH]          (signal_dspin_bound_p2m_in[x][0][SOUTH]);
875       clusters[x][0]->p_p2m_out[SOUTH]         (signal_dspin_bound_p2m_out[x][0][SOUTH]);
876       clusters[x][Y_SIZE-1]->p_p2m_in[NORTH]   (signal_dspin_bound_p2m_in[x][Y_SIZE-1][NORTH]);
877       clusters[x][Y_SIZE-1]->p_p2m_out[NORTH]  (signal_dspin_bound_p2m_out[x][Y_SIZE-1][NORTH]);
878
879       clusters[x][0]->p_cla_in[SOUTH]          (signal_dspin_bound_cla_in[x][0][SOUTH]);
880       clusters[x][0]->p_cla_out[SOUTH]         (signal_dspin_bound_cla_out[x][0][SOUTH]);
881       clusters[x][Y_SIZE-1]->p_cla_in[NORTH]   (signal_dspin_bound_cla_in[x][Y_SIZE-1][NORTH]);
882       clusters[x][Y_SIZE-1]->p_cla_out[NORTH]  (signal_dspin_bound_cla_out[x][Y_SIZE-1][NORTH]);
883   }
884
885   std::cout << std::endl << "North & South boundaries connections done" << std::endl;
886   std::cout << std::endl;
887
888
889#ifdef WT_IDL
890    std::list<VciCcVCacheWrapper<vci_param_int,
891        dspin_cmd_width,
892        dspin_rsp_width,
893        GdbServer<Mips32ElIss> > * > l1_caches;
894
895   for (size_t x = 0; x < X_SIZE; x++) {
896      for (size_t y = 0; y < Y_SIZE; y++) {
897         for (int proc = 0; proc < NB_PROCS_MAX; proc++) {
898            l1_caches.push_back(clusters[x][y]->proc[proc]);
899         }
900      }
901   }
902
903   for (size_t x = 0; x < X_SIZE; x++) {
904      for (size_t y = 0; y < Y_SIZE; y++) {
905         clusters[x][y]->memc->set_vcache_list(l1_caches);
906      }
907   }
908#endif
909
910
911//#define SC_TRACE
912#ifdef SC_TRACE
913   sc_trace_file * tf = sc_create_vcd_trace_file("my_trace_file");
914
915   if (X_SIZE > 1){
916      for (size_t x = 0; x < (X_SIZE-1); x++){
917         for (size_t y = 0; y < Y_SIZE; y++){
918            for (size_t k = 0; k < 3; k++){
919               signal_dspin_h_cmd_inc[x][y][k].trace(tf, "dspin_h_cmd_inc");
920               signal_dspin_h_cmd_dec[x][y][k].trace(tf, "dspin_h_cmd_dec");
921            }
922
923            for (size_t k = 0; k < 2; k++){
924               signal_dspin_h_rsp_inc[x][y][k].trace(tf, "dspin_h_rsp_inc");
925               signal_dspin_h_rsp_dec[x][y][k].trace(tf, "dspin_h_rsp_dec");
926            }
927         }
928      }
929   }
930
931   if (Y_SIZE > 1) {
932      for (size_t y = 0; y < (Y_SIZE-1); y++){
933         for (size_t x = 0; x < X_SIZE; x++){
934            for (size_t k = 0; k < 3; k++){
935               signal_dspin_v_cmd_inc[x][y][k].trace(tf, "dspin_v_cmd_inc");
936               signal_dspin_v_cmd_dec[x][y][k].trace(tf, "dspin_v_cmd_dec");
937            }
938
939            for (size_t k = 0; k < 2; k++){
940               signal_dspin_v_rsp_inc[x][y][k].trace(tf, "dspin_v_rsp_inc");
941               signal_dspin_v_rsp_dec[x][y][k].trace(tf, "dspin_v_rsp_dec");
942            }
943         }
944      }
945   }
946
947   for (size_t x = 0; x < (X_SIZE); x++){
948      for (size_t y = 0; y < Y_SIZE; y++){
949         std::ostringstream signame;
950         signame << "cluster" << x << "_" << y;
951         clusters[x][y]->trace(tf, signame.str());
952      }
953   }
954#endif
955
956
957   ////////////////////////////////////////////////////////
958   //   Simulation
959   ///////////////////////////////////////////////////////
960
961   sc_start(sc_core::sc_time(0, SC_NS));
962   signal_resetn = false;
963
964   // set network boundaries signals default values
965   // for all boundary clusters
966   for (size_t x = 0; x < X_SIZE ; x++) {
967       for (size_t y = 0; y < Y_SIZE ; y++) {
968           for (size_t face = 0; face < 4; face++) {
969               signal_dspin_bound_cmd_in [x][y][face].write = false;
970               signal_dspin_bound_cmd_in [x][y][face].read  = true;
971               signal_dspin_bound_cmd_out[x][y][face].write = false;
972               signal_dspin_bound_cmd_out[x][y][face].read  = true;
973
974               signal_dspin_bound_rsp_in [x][y][face].write = false;
975               signal_dspin_bound_rsp_in [x][y][face].read  = true;
976               signal_dspin_bound_rsp_out[x][y][face].write = false;
977               signal_dspin_bound_rsp_out[x][y][face].read  = true;
978
979               signal_dspin_bound_m2p_in [x][y][face].write = false;
980               signal_dspin_bound_m2p_in [x][y][face].read  = true;
981               signal_dspin_bound_m2p_out[x][y][face].write = false;
982               signal_dspin_bound_m2p_out[x][y][face].read  = true;
983
984               signal_dspin_bound_p2m_in [x][y][face].write = false;
985               signal_dspin_bound_p2m_in [x][y][face].read  = true;
986               signal_dspin_bound_p2m_out[x][y][face].write = false;
987               signal_dspin_bound_p2m_out[x][y][face].read  = true;
988
989               signal_dspin_bound_cla_in [x][y][face].write = false;
990               signal_dspin_bound_cla_in [x][y][face].read  = true;
991               signal_dspin_bound_cla_out[x][y][face].write = false;
992               signal_dspin_bound_cla_out[x][y][face].read  = true;
993           }
994       }
995   }
996
997   sc_start(sc_core::sc_time(1, SC_NS));
998   signal_resetn = true;
999
1000   if (debug_ok) {
1001      #if USE_OPENMP
1002         assert(false && "OPEN MP should not be used with debug because of its traces");
1003      #endif
1004
1005      if (gettimeofday(&t1, NULL) != 0) {
1006         perror("gettimeofday");
1007         return EXIT_FAILURE;
1008      }
1009
1010      for (int64_t n = 1; n < ncycles && !stop_called; n++)
1011      {
1012         if ((n % max_cycles) == 0)
1013         {
1014
1015            if (gettimeofday(&t2, NULL) != 0)
1016            {
1017               perror("gettimeofday");
1018               return EXIT_FAILURE;
1019            }
1020
1021            ms1 = (uint64_t) t1.tv_sec * 1000ULL + (uint64_t) t1.tv_usec / 1000;
1022            ms2 = (uint64_t) t2.tv_sec * 1000ULL + (uint64_t) t2.tv_usec / 1000;
1023            std::cerr << "platform clock frequency " << (double) 5000000 / (double) (ms2 - ms1) << "Khz" << std::endl;
1024
1025            if (gettimeofday(&t1, NULL) != 0)
1026            {
1027               perror("gettimeofday");
1028               return EXIT_FAILURE;
1029            }
1030         }
1031
1032
1033         if (n == reset_counters) {
1034            for (size_t x = 0; x < (X_SIZE); x++) {
1035               for (size_t y = 0; y < Y_SIZE; y++) {
1036                  clusters[x][y]->memc->reset_counters();
1037               }
1038            }
1039         }
1040
1041         if (n == dump_counters) {
1042            for (size_t x = 0; x < (X_SIZE); x++) {
1043               for (size_t y = 0; y < Y_SIZE; y++) {
1044                  clusters[x][y]->memc->print_stats(true, false);
1045               }
1046            }
1047         }
1048
1049         if ((n > debug_from) and (n % debug_period == 0))
1050         {
1051            std::cout << "****************** cycle " << std::dec << n ;
1052            std::cout << "************************************************" << std::endl;
1053
1054            for (size_t x = 0; x < X_SIZE ; x++){
1055               for (size_t y = 0; y < Y_SIZE ; y++){
1056                  for (int proc = 0; proc < NB_PROCS_MAX; proc++) {
1057                     clusters[x][y]->proc[proc]->print_trace();
1058                     std::ostringstream proc_signame;
1059                     proc_signame << "[SIG]PROC_" << x << "_" << y << "_" << proc ;
1060                     std::ostringstream p2m_signame;
1061                     p2m_signame << "[SIG]PROC_" << x << "_" << y << "_" << proc << " P2M";
1062                     std::ostringstream m2p_signame;
1063                     m2p_signame << "[SIG]PROC_" << x << "_" << y << "_" << proc << " M2P";
1064
1065                     clusters[x][y]->signal_vci_ini_proc[proc].print_trace(proc_signame.str());
1066                     clusters[x][y]->signal_dspin_p2m_proc[proc].print_trace(p2m_signame.str());
1067                     clusters[x][y]->signal_dspin_m2p_proc[proc].print_trace(m2p_signame.str());
1068                  }
1069
1070                  clusters[x][y]->memc->print_trace();
1071
1072                  std::ostringstream smemc;
1073                  smemc << "[SIG]MEMC_" << x << "_" << y;
1074                  std::ostringstream sxram;
1075                  sxram << "[SIG]XRAM_" << x << "_" << y;
1076                  std::ostringstream sm2p;
1077                  sm2p << "[SIG]MEMC_" << x << "_" << y << " M2P";
1078                  std::ostringstream sp2m;
1079                  sp2m << "[SIG]MEMC_" << x << "_" << y << " P2M";
1080
1081                  clusters[x][y]->signal_vci_tgt_memc.print_trace(smemc.str());
1082                  clusters[x][y]->signal_vci_xram.print_trace(sxram.str());
1083                  clusters[x][y]->signal_dspin_p2m_memc.print_trace(sp2m.str());
1084                  clusters[x][y]->signal_dspin_m2p_memc.print_trace(sm2p.str());
1085               }
1086            }
1087         }
1088
1089         sc_start(sc_core::sc_time(1, SC_NS));
1090      }
1091   }
1092   else {
1093      int64_t n = 0;
1094      while (!stop_called && n != ncycles) {
1095         if (gettimeofday(&t1, NULL) != 0) {
1096            perror("gettimeofday");
1097            return EXIT_FAILURE;
1098         }
1099         int64_t nb_cycles = min(max_cycles, ncycles - n);
1100         if (do_reset_counters) {
1101            nb_cycles = min(nb_cycles, reset_counters - n);
1102         }
1103         if (do_dump_counters) {
1104            nb_cycles = min(nb_cycles, dump_counters - n);
1105         }
1106
1107         sc_start(sc_core::sc_time(nb_cycles, SC_NS));
1108         n += nb_cycles;
1109
1110         if (do_reset_counters && n == reset_counters) {
1111            // Reseting counters
1112            for (size_t x = 0; x < (X_SIZE); x++) {
1113               for (size_t y = 0; y < Y_SIZE; y++) {
1114                  clusters[x][y]->memc->reset_counters();
1115               }
1116            }
1117            do_reset_counters = false;
1118         }
1119
1120         if (do_dump_counters && n == dump_counters) {
1121            // Dumping counters
1122            for (size_t x = 0; x < (X_SIZE); x++) {
1123               for (size_t y = 0; y < Y_SIZE; y++) {
1124                  clusters[x][y]->memc->print_stats(true, false);
1125               }
1126            }
1127            do_dump_counters = false;
1128         }
1129
1130
1131         if (gettimeofday(&t2, NULL) != 0) {
1132            perror("gettimeofday");
1133            return EXIT_FAILURE;
1134         }
1135         ms1 = (uint64_t) t1.tv_sec * 1000ULL + (uint64_t) t1.tv_usec / 1000;
1136         ms2 = (uint64_t) t2.tv_sec * 1000ULL + (uint64_t) t2.tv_usec / 1000;
1137         std::cerr << std::dec << "cycle " << n << " platform clock frequency " << (double) nb_cycles / (double) (ms2 - ms1) << "Khz" << std::endl;
1138      }
1139   }
1140
1141
1142   // Free memory
1143   for (size_t i = 0; i  < (X_SIZE * Y_SIZE); i++)
1144   {
1145      size_t x = i / Y_SIZE;
1146      size_t y = i % Y_SIZE;
1147      delete clusters[x][y];
1148   }
1149
1150   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_h_cmd_inc, X_SIZE-1, Y_SIZE);
1151   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_h_cmd_dec, X_SIZE-1, Y_SIZE);
1152
1153   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_h_rsp_inc, X_SIZE-1, Y_SIZE);
1154   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_h_rsp_dec, X_SIZE-1, Y_SIZE);
1155
1156   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_h_m2p_inc, X_SIZE-1, Y_SIZE);
1157   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_h_m2p_dec, X_SIZE-1, Y_SIZE);
1158
1159   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_h_p2m_inc, X_SIZE-1, Y_SIZE);
1160   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_h_p2m_dec, X_SIZE-1, Y_SIZE);
1161
1162   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_h_cla_inc, X_SIZE-1, Y_SIZE);
1163   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_h_cla_dec, X_SIZE-1, Y_SIZE);
1164
1165   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_v_cmd_inc, X_SIZE, Y_SIZE-1);
1166   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_v_cmd_dec, X_SIZE, Y_SIZE-1);
1167
1168   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_v_rsp_inc, X_SIZE, Y_SIZE-1);
1169   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_v_rsp_dec, X_SIZE, Y_SIZE-1);
1170
1171   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_v_m2p_inc, X_SIZE, Y_SIZE-1);
1172   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_v_m2p_dec, X_SIZE, Y_SIZE-1);
1173
1174   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_v_p2m_inc, X_SIZE, Y_SIZE-1);
1175   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_v_p2m_dec, X_SIZE, Y_SIZE-1);
1176
1177   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_v_cla_inc, X_SIZE, Y_SIZE-1);
1178   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_v_cla_dec, X_SIZE, Y_SIZE-1);
1179
1180   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_bound_cmd_in, X_SIZE, Y_SIZE, 4);
1181   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_bound_cmd_out, X_SIZE, Y_SIZE, 4);
1182
1183   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_bound_rsp_in, X_SIZE, Y_SIZE, 4);
1184   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_bound_rsp_out, X_SIZE, Y_SIZE, 4);
1185
1186   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_bound_m2p_in, X_SIZE, Y_SIZE, 4);
1187   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_bound_m2p_out, X_SIZE, Y_SIZE, 4);
1188
1189   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_bound_p2m_in, X_SIZE, Y_SIZE, 4);
1190   dealloc_elems<DspinSignals<dspin_rsp_width> >(signal_dspin_bound_p2m_out, X_SIZE, Y_SIZE, 4);
1191
1192   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_bound_cla_in, X_SIZE, Y_SIZE, 4);
1193   dealloc_elems<DspinSignals<dspin_cmd_width> >(signal_dspin_bound_cla_out, X_SIZE, Y_SIZE, 4);
1194
1195   return EXIT_SUCCESS;
1196}
1197
1198
1199void handler(int dummy = 0) {
1200   stop_called = true;
1201   sc_stop();
1202}
1203
1204void voidhandler(int dummy = 0) {}
1205
1206int sc_main (int argc, char *argv[])
1207{
1208   signal(SIGINT, handler);
1209   signal(SIGPIPE, voidhandler);
1210
1211   try {
1212      return _main(argc, argv);
1213   } catch (std::exception &e) {
1214      std::cout << e.what() << std::endl;
1215   } catch (...) {
1216      std::cout << "Unknown exception occured" << std::endl;
1217      throw;
1218   }
1219   return 1;
1220}
1221
1222
1223// Local Variables:
1224// tab-width: 3
1225// c-basic-offset: 3
1226// c-file-offsets:((innamespace . 0)(inline-open . 0))
1227// indent-tabs-mode: nil
1228// End:
1229
1230// vim: filetype=cpp:expandtab:shiftwidth=3:tabstop=3:softtabstop=3
Note: See TracBrowser for help on using the repository browser.