Context Navigation

Changes between Version 16 and Version 17 of MjpegCourse/Coproc

Timestamp:: Mar 6, 2007, 6:58:52 PM (17 years ago)
Author:: alain
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

MjpegCourse/Coproc

-                      v16
+                      v17
 == mettre ici le dessin contenant le threader ==
 Pour utiliser un tel coprocesseur ''virtuel'', il faut modifier deux choses dans la description DSX:
  * dans la définition du modèle de la tâche {{{idct}}}, il faut ajouter l'implémentation `SyntheticTask()`
+Pour utiliser un tel coprocesseur ''virtuel'', il faut modifier trois choses dans la description DSX:
+ * dans la définition du modèle de la tâche {{{idct}}}, il faut ajouter l'implémentation `SyntheticTask()`. Le coprocesseur matériel étant paramètrable, ill faut également définir un nouveau paramètre `EXEC_TIME` dans la liste des paramètres de la tâche {{{idct}}}. Ce paramètre permet de spécifier le nombre de cycles utilisés par le coprocesseur matériel pour effectuer la transformation IDCT d'un bloc de 64 pixels.
 {{{
 idct = TaskModel(
 …
                                                  stack_size = 1024,
                                                  sources = [ 'src/idct.c' ],
+                                                 defines = [ 'WIDTH', 'HEIGHT' ] ),
+                              SyntheticTask()   ] )
+                                                 defines = [ 'WIDTH', 'HEIGHT','EXEC_TIME' ] ),
+                       SyntheticTask()   ] )
+}}}
+ * La valeur du paramètre  EXEC_TIME doit être définie au moment où on instancie la tâche {{{idct}}} dans le TCG.
+{{{
+Task( 'idct0' , idct ,
+                portmap = {     'output':idct_libu,
+                                'input' :iqzz_idct },
+                defines = {     'XSIZE':'48', 'YSIZE':'48', 'EXEC_TIME':'64'} )
 }}}
  * Dans la partie déploiement, il faut déployer la tâche {{{idct}}} comme une tâche matérielle (comme on l'a fait pour les tâches {{{ramdac}}} ou {{{tg}}}.
 …
 }}}
 Après synthèse, le coprocesseur matériel IDCT (comme beaucoup de coprocesseurs matériels de type ''flot de données'')
+Le coprocesseur matériel IDCT (comme beaucoup de coprocesseurs matériels de type ''flot de données'')
 exécute une boucle infinie dans laquelle il effectue successivement les actions suivantes:
 . recopie d'un bloc de 64 coefficients du canal MWMR d'entrée vers une mémoire locale BUFIN,
 …
 . recopie de ces 64 pixels de la mémoire locale BUFOUT vers le canal MWMR de sortie.
-[[Image(MjpegCourse:q.gif)]] Q2. Combien de coefficients sont transférés par cycle sur  l'interface FIFO d'entrée? Combien  de pixels sont
-transférés par cycle sur l'interface FIFO de sortie? En déduire les durées minimales (en nombre de cycles) pour les étapes 1 et 3 ci-dessus.
 Les temps de communication correspondant aux étapes 1 et 3 sont précisément décrits par le simulateur SystemC,
 qui reproduit (cycle par cycle) le comportement des interfaces FIFO entre le threader et le contrôleur MWMR
 (y compris en cas de contention pour l'accès à la mémoire).
+En revanche, le nombre de cycles nécessaires pour exécuter l'étape 2 ci-dessus (temps de calcul "interne" à la tâche logicielle)
+n'est pas défini par le code de la tâche logicielle. Si on ne précise rien, cela correspond à un temps d'exécution du calcul
+en "zéro" cycles. Pour préciser un nombre de cycles d'exécution, il faut modifier le code C de la tâche {{{idct}}}, et insérer,
+[[Image(MjpegCourse:q.gif)]] Q2. Combien de coefficients sont transférés par cycle sur  l'interface FIFO d'entrée? Combien  de pixels sont
+transférés par cycle sur l'interface FIFO de sortie? En déduire les durées minimales (en nombre de cycles) pour les étapes 1 et 3 ci-dessus.
+Le nombre de cycles nécessaires pour exécuter l'étape 2 ci-dessus (temps de calcul pour un bloc de 64 pixels) est
+défini par la valeur du paramètre EXEC_TIME.  Si on ne précise rien, cela correspond à un temps d'exécution de "zéro" cycles.
+Pour préciser un nombre de cycles d'exécution, il faut modifier le code C de la tâche {{{idct}}}, et insérer,
 entre les deux primitives ''srl_mwmr_read()'' et ''srl_mwmr_write()'',
+un appel à la  la fonction bloquante ''srl_busy_cycles(ncycles)''. L'argument ''ncycles'' est le nombre de cycles d'attente entre les
+deux primitives de communication, et il modélise donc le temps de calcul (voir SrlApi).
+{{{
+un appel à la  la fonction bloquante ''srl_busy_cycles()''. {{{
 srl_mwmr_read();
 ...
 srl_busy_cycles( n );
+srl_busy_cycles( EXEC_TIME );
 ...
 srl_mwmr_write();
 }}}
+L'argument EXEC_TIME définit le nombre de cycles d'attente entre les
+deux primitives de communication, et modélise donc le temps de calcul (voir SrlApi).
 [[Image(MjpegCourse:q.gif)]] Q3. pour quelle raison peut-on affirmer sans aucune expérimentation (c'est à dire sans aucune simulation),