dimanche 27 janvier 2013

Occurrences et compagnie

Comme annoncé dans le message précédent, en ce moment je fais beaucoup de relevés d'occurrences. A vrai dire, si ça me prend une bonne partie de mes journées et me vide littéralement de mon énergie pour un résultat qui, pendant longtemps, ne sera pas très visible (seuls ceux qui ont passé des jours à indexer une base de données peuvent me comprendre), c'est parce que à la fois je ne pouvais pas le faire avant (il fallait d'abord que je dresse une liste des termes à chercher et, ne serait-ce que pour cela, lire au moins deux fois toutes les oeuvres de mon corpus) et j'ai plus ou moins remis cette corvée ce passionnant travail jusqu'à que j'en aie vraiment besoin. En l'occurrence, j'ai commencé la rédaction, ce serait mieux si je pouvais la faire en suivant l'ordre de mon plan et j'ai besoin de ces données pour ma première partie : chouette...

Pourquoi est-ce que je fais cela ?

Comme je m'intéresse à la façon dont les informations sont présentées et introduites dans le texte, évidemment je passe beaucoup de temps à étudier des passages particuliers. Mais je me suis très vite rendue compte (dès mon M2 sur les rumeurs, pour être honnête) qu'il était aussi très intéressant de savoir combien de fois une expression ou un mot revenait dans l'oeuvre de mes auteurs, comment ils était modulés (i.e. avec quels autres mots, moins centraux, ils étaient combinés) et, surtout, s'ils apparaissaient plus ou moins toujours dans le même contexte. Les questions que je me pose sont par exemple : est-ce que Tacite et Suétone utilisent toujours le verbe tradere pour désigner une source écrite ? est-ce que le terme fama renvoie généralement à une information dont la véracité est plus ou moins douteuse ? etc.

Ceux qui me subissent lisent ce blog depuis le début (ou sont allés faire un tour dans ses archives) savent que cette histoire est un peu ma marotte depuis des années et me vaut, de la part de mes amis, une réputation de crypto-linguiste (comprenez : je ne fais pas de linguistique, mais ça m'intéresse quand même et j'ai d'ailleurs retenu beaucoup trop de choses de mes cours d'indo-européens à Ulm et de linguistique grecque et romaine pour que ce ne soit pas louche ; amis linguistes qui passeriez par ici, nous sommes d'accord : ce que je fais n'est pas de la linguistique).

(Voilà un accident du travail qui ne risque pas de m'arriver ; encore que : dans la bibliothèque d'Ulm, on ne sait jamais ce qui peut arriver ; photo par That Bill Fellow ; source : Flicker)


Là encore, concrètement, ça se passe comment ?

Concrètement, je fais ce qu'on appelle des recherches morphologiques, i.e. que je cherche toutes les formes possibles d'un mot (que ce soit un nom, un verbe ou un adjectif) dans les deux corpora (et oui, le pluriel de corpus, c'est corpora). Pour mon M2, j'ai tout fait à la main, en notant scrupuleusement dans des tableaux chaque référence que je trouvais à la lecture. Ce fut long, fastidieux et, à la fin, ça a bien failli me rendre folle, car les totaux étaient toujours différents.

Cette fois-ci, j'ai donc décidé de me la jouer scientifique. Comprenez : à moi la technologie !

Au début, j'utilisais, via les ressources en ligne de la BNF (accessibles avec une carte recherche), la Bibliotheca Teubneriana Latina. Comprendre : l'édition en ligne des textes latins publiés par l'édition allemande de référence Teubner. Mais quelqu'un qui devait se prendre pour un génie a décidé d'en refaire l'interface, ce qui, dans un premier temps, a fait qu'on ne pouvait plus y accéder par la BN et, ensuite, l'a rendu totalement inutilisable : plus de texte directement accessible (alors que c'est majoritairement pour cette raison qu'on consulte l'édition Teubner), des listes avec uniquement des références (ce qui ne sert absolument à rien), sans indication sur quelle forme a été relevée, dans quel contexte et, surtout, avec des notations de passages qui ne correspondent pas à l'harmonisation qui a eu lieu depuis très longtemps (comprenez : on divise chaque livre antique en paragraphes et en chapitres ; au début, chaque éditeur faisait plus ou moins comme il l'entendait, puis on s'est mis d'accord pour que Tac., Ann. XVI 42.3 corresponde au même texte, quelle que soit l'édition).

Si certains éditeurs et informaticiens pouvaient se mettre à la place des usagers, ce serait bien. J'en suis presque à me demander si ce n'est pas une tactique pour obliger les gens à délaisser l'édition numérique pour n'utiliser que le papier.

("Hé, Steve ! Tu as vu comme le site de De Gruyter est encore plus nul à chier que d'habitude ? - Oui, j'ai vu, Bill ! C'est pas encore aujourd'hui que les latinistes vont dominer le monde !" ; photo par Joi Ito ; source : Fotopedia)


Je me suis donc rabattue sur le bon vieux Diogenes, logiciel en libre accès permettant de faire des recherches dans les deux bases de données de littérature antique (l'Ultime Solution étant le moteur de Perseus, mais vu comme ça a tendance à ramer pour avoir un texte, je n'ose imaginer ce que ça peut donner pour le reste). J'ai toujours ce problème des références (les éditions répertoriées sont celles qui sont libres de droit, ce qui veut dire qu'elles sont assez anciennes, à l'inverse - théoriquement- des Teubner), mais, au moins, je peux lire tout de suite le texte ; je me contente de vérifier sur mes Budé papier lorsqu'une référence m'intéresse.

Grâce à tout cela, je fais de Magnifiques Tableaux (si, si, ils sont magnifiques), dont j'essaie ensuite de voir si je peux en tirer quelque chose de significatif. Ne me demandez pas si j'ai déjà des résultats : j'en suis encore à rassembler des données et tenter de ne pas me désespérer devant "Dicere + Tacite : 174 résultats" (yeeepeeee ! des heures d'ennui mortel de jeu en perspective !). C'est ça, aussi, la thèse...

(Un magnifique tableau)

1 commentaire:

  1. À propos de Bill Gates et Steve Jobs.

    Figurez-vous que la famille Packard (de chez Hewlett-Packard) a donné beaucoup pour les humanités anciennes, notamment l'épigraphie grecque !

    Quant à Gates, il avait commencé des recherches en informatique théorique avec Christos H. Papadimitriou (ou, LE Papadimitriou).

    Serait-ce là encore l'influence grecque ?

    RépondreSupprimer