Zoeken naar vooruitgang
Ieder zichzelf respecterend instituut komt tegenwoordig met het bericht dat
alle vaart uit de economische vooruitgang verdwenen is. IMF, Wereldbank, OESO en een
hele batterij academische economen melden dat de
technische vooruitgang, of preciezer gezegd totale factor productiviteit
(TFP), minimaal is - en naar verwachting minimaal zal blijven. Die laatste
boodschap wordt vaak vervat met de mededeling dat we te maken hebben met
het fenomeen van de zogenaamde ‘seculiere stagnatie’: een stagnatie in de
vooruitgang waar we ons met de beste wil van de wereld niet aan blijken te
kunnen onttrekken.
Mijn eerste intuïtie bij dit soort berichten en bevindingen is: ‘wat gek!’. We worden bestookt met berichten over de opmars
van innovaties – denk aan gentechnologie of AI (Artificial Intelligence) en de vele toepassingen daarvan – en daar
zouden we dan blijkbaar niet veel of helemaal niets van merken. Dat lijkt
me toch stug, maar laten we eens nadenken over waar deze berichten vandaan
komen.
De meeste onheilsberichten over stagnatie zijn gebaseerd op macro-economische
groeiboekhoudanalyses. Macro-economie is een mooi vak, maar het is ook een
vak met veel conventies in meten en weten. Niet voor niets karakteriseerde Moses Abramovitz
(1956, 1993) de vele analyses over de bron van economische groei als "de meting
van onze onwetendheid". De vele TFP- en productiviteitsanalyses zien er
vaak betrouwbaar en solide uit, maar zijn eigenlijk ten diepste een ode aan de
wijsheid van Abramovitz.
Vijftien Jaar Me Judice
|
Deze bijdrage is onderdeel van de jubileumreeks (zomer 2023) in het kader van het vijftienjarige bestaan van Me Judice. De redactie vroeg vijftien vooraanstaande economen: ‘’welk debat moet in de toekomst (meer) worden gevoerd?’’. De reeks vindt u hier terug. |
Maar wat dan? Een begin van een antwoord komt van Nicholas Bloom en zijn collega’s (2020). Zij probeerden
onlangs een dieper antwoord te vinden waarom we deze vertraging van
technische vooruitgang meemaken. Ze zoeken de antwoorden in het proces
van onderzoek en ontwikkeling, oftewel de productie van nieuwe ideeën.
Micro-economisch onderzoek is altijd gewenst en is een goede controle van
wat er plaatsvindt op macro-economisch niveau. De bron van technische
vooruitgang waar een maatschappij lang op kan teren is volgens hun analyses
voornamelijk terug te vinden in het onderzoek dat radicaal ons werk en ons leven verandert.
Als voorbeeld noemen ze de Wet van Moore, een van de oprichters van Intel, die ooit stelde dat het aantal transistors in een geïntegreerde schakeling door de technologische vooruitgang ieder jaar verdubbelt. Om die wet gaande te houden zouden er nu 18 keer zoveel onderzoekers nodig zijn in vergelijking met het aantal onderzoekers in de jaren zeventig. Anders gesteld: het is nu 18 keer moeilijker dan toen om de exponentiële groei achter de Wet van Moore te bewerkstelligen. Als je de sectoren of bedrijven
onderzoekt die zich met soortgelijk groots onderzoek bezighouden, zoals gezondheidszorg, voedselproductie of IT, dan komt daar ook uit naar voren dat er iets
goed mis is: de groei van nieuwe ideeën neemt overal af.
De bron van technische vooruitgang waar een maatschappij lang op kan teren is [...] voornamelijk terug te vinden in het onderzoek dat radicaal ons werk en ons leven verandert.
Dat ligt niet
zozeer aan het aantal onderzoekers dat ingezet wordt – over de tijd is dat
aantal alleen maar gegroeid. Nee, het ligt volgens Bloom et al. aan
de ‘productiviteit’ van onderzoekers die zó sterk is afgenomen dat het de
kracht van de groei van het aantal onderzoekers overtreft. De ‘disruptieve’
uitvindingen - beter bekend als General Purpose Technologies (GPT) - waar we allemaal om staan te springen - zijn volgens hen steeds
moeilijker te vinden. Het laaghangende fruit is reeds geplukt, zo vermoeden de onderzoekers.
Kijk, dat zijn nog eens bevindingen waar we de tanden in kunt zetten. Ik
geef twee interpretaties waar we een debat over kunnen, maar mijns inziens ook moeten, voeren. Er is iets
mis met hoe we onderzoek organiseren en uitvoeren – die analyse
van Bloom et al. is toch wel een teken aan de wand - en er is iets mis met
hoe we die vooruitgang meten.
Stelling 1: De organisatie van onderzoek is disfunctioneel geworden
Groots onderzoek begint vaak met groots denken. Zo hoort zeker
de wetenschap te functioneren - en je zou verwachten dat het met onderzoek en ontwikkeling in het
bedrijfsleven ook zo zou werken. Dat beeld zou wellicht nog wel kloppen als je vijftig jaar terug in de tijd gaat en bij de
elite-universiteiten aanklopte. Sindsdien is de wetenschap echter een
waar wetenschappelijk bedrijf geworden. Het gaat erom dat je
gezien wordt in het juiste tijdschrift, bij de juiste congressen en met een
baan bij de juiste universiteit. Een tekenend citaat van die cultuur heb ik
ooit aangetroffen in een onderzoek naar hoe Amerikaanse economen hun
wetenschappelijke kennis waarderen. Een van de deelnemers drukt precies uit
wat er mis is met academisch onderzoek, in de economische wetenschappen,
maar het geldt met evenveel gemak voor de andere sociale wetenschappen. Dit
is wat deze Amerikaanse econoom zei:
“As an economist, you have to believe that the current equilibrium is
the best way to do things, but I think we’re very inefficient at
producing research to the extent that research is supposed to benefit
society. Again, to the extent research is a signaling mechanism, we’re
all just playing chess games to show we know how to play chess.”
(in Reay, 2007).
Met andere woorden, wetenschap is verworden tot een schaakclub. De 'zetten' die je doet als wetenschapper zijn meer bedoeld om te laten zien
naar werkgevers, naar collega-wetenschappers dat je slim bent en het waard
bent om opgenomen te worden in de club. De concentratie op het spel - en niet
de inhoud van het vak - is een gewoonte waar wetenschappers moeilijk aan
kunnen ontsnappen.
De wetenschap is verworden tot een schaakclub. De 'zetten' die je doet als wetenschapper zijn bedoeld om te laten zien dat je slim bent en het waard bent om opgenomen te worden in de club.
Alleen als je wellicht de top hebt bereikt kun je met
enige autoriteit ‘zien’ wat er mis is met het huidig economisch onderzoek. Zo geven Nobelprijswinnaars Akerlof (2020) en Heckman (2020) stevige en
behartenswaardige kritiek op hoe de economische wetenschap functioneert – de
modes in methoden die aandacht voor andere methoden wegdrukken en de gekte
rond top-5 tijdschriften.
Daarnaast zie ik ook het kortetermijndenken als hinderpaal
voor vooruitgang, en die korte termijn komt vooral terug in de
beloningsstructuur in de wetenschap. Het gebruik van citaties en
publicaties als evaluatie en beloningsmaatstaf leidt tot marginale
publicaties (Packalen en Bhattacharya, 2020). Riskant fundamenteel
onderzoek wordt uit de weg gegaan. Deze ‘publish-or-perish’-cultuur had
ooit de intentie om juist de innovatieproductiviteit aan te jagen, maar het
tegenovergestelde lijkt bereikt te zijn. Van deze cultuur was vóór de jaren
negentig nog weinig te merken in Europese universiteiten, maar dat is sinds
die tijd stevig omarmd als kwaliteitsmaatstaf voor selectie en werving (Van
Dalen, 2021, Van Dalen en Henkens, 2012).
Het
DORA-manifest (Declaration on Research Assessment) en de Nederlandse
equivalent van dit programma - ‘Erkennen en waarderen’ - vormen de
tegenreactie op het ‘publish-or-perish’-adagium. Zelf heb ik twijfels of dit de juiste ontwikkeling is, zeker als dit soort programma’s
nationaal of internationaal top-down worden opgelegd door overkoepelende
onderzoeksorganisaties en overheden. Het écht groots denken wordt niet
gestimuleerd en het ene ritueel van belonen en waarderen wordt vervangen door een ander bureaucratisch ritueel met nog meer verfijnde indicatoren. Het is een nieuwe meetlat die weer laat zien dat alles in orde is richting geldgevers en potentiële studenten. Wetenschap wordt gereguleerd door sociale normen; normen die je door socialisatie binnen de gemeenschap leert en toepast. De kracht van de wetenschap is dat die sociale normen van het werk ongeschreven zijn. Wat de moderne wetenschap echter doet en karakteriseert is om de sociale normen tot wetten te maken, waarmee je de vrijheid van werken en denken inperkt.
Een
bottom-up benadering is meer op zijn plaats om zo de experimenteerlust van wetenschappers ruimte te geven: laat een faculteit of
onderzoeksinstituut zelf bepalen hoe men iemand beloont of waardeert en laat
die faculteit dan zelf aantonen dat de eigen aanpak werkt. Probeer eens wat
anders dan NWO-commissies die een jaar lang worstelen met het bepalen van
excellente onderzoeksplannen. Johan Bollen en Marten Scheffer hebben een aantal jaren terug het voorstel gedaan om individuele
onderzoekers geld toe te laten delen aan de onderzoekers die zij het waard vinden om
onderzoek te laten doen. Op basis van simulaties komen zij tot de conclusie dat de allocatie van onderzoeksgeld niet wezenlijk anders is dan wat NWO doet, maar dan uiteraard zonder de bureaucratische rompslomp voor aanvragers en beoordelaars. Een aantal jaren
terug is op
Me Judice een peiling gehouden onder vooraanstaande economen, waaruit er een zeer hoge mate van
onvrede bleek over hoe NWO functioneert en dat we de verdeling van
onderzoeksgelden weg moeten halen bij NWO en beter op decentrale wijze
kunnen verdelen door individuele onderzoekers.
Laat een faculteit of onderzoeksinstituut zelf bepalen hoe men iemand beloont of waardeert en laat die faculteit dan zelf aantonen dat de eigen aanpak werkt.
Daarnaast lijkt het prikkelen van de productiviteit de wetenschap als geheel
ook geen goed te doen. Het is de bekende valkuil van outputfinanciering (Kerr, 1975, Osterloh en Frey, 2015): wie A (innovatie) wil maar B (publicaties, citaties, promoties als indicator van innovatie) beloont, krijgt uiteindelijk B en niet A. Er zijn nu zoveel onderzoekers die meedoen dat het
publicatie- en referentensysteem ontploft. Er worden tijdschriften (en daarmee citaties) gecreëerd met namen die een wel heel smalle niche lijken te bedienen. En in
het bedienen van de immer stijgende vraag naar publicatie-outlets voor
onderzoekers gaan grote tijdschriften (zoals Journal of Political Economy en American Economic Review)
dochter-tijdschriften bedenken om zo het aura van het moedertijdschrift te
verkopen. Daarnaast springen er fake- en graaitijdschriften in het gat om jonge
onderzoekers aan boord te hijsen; tijdschriften voor wie publiceren puur een verdienmodel is en wetenschap een ‘haakje’.
De markt voor publicaties
is uit zijn voegen gebarsten. Dat dit niet zonder consequenties blijft
laten onderzoekers Chu en Evans (2021) zien. De populatie van artikelen en
tijdschriften (waaronder veel marginale tijdschriften) neemt ieder jaar
alleen maar toe en het zicht en de aandacht van wetenschappers doet
verslappen, waardoor het steeds moeilijker is om onderzoek te publiceren dat
de status quo verstoort. De aandacht in verschillende onderzoeksvelden
wordt in toenemende mate bepaald door oude doorbraakartikelen, nieuwe
doorbraken worden minder genoteerd.
Stelling 2: De conventionele meting van economische vooruitgang is
misleidend
Mijn tweede stelling kan wel verbonden worden aan de eerste stelling, omdat
het onderzoek over groeiboekhouden eigenlijk ook aangeeft dat groots denken
in dit onderdeel van de economie ontbreekt. Ieder macro-economisch
instituut rapporteert jaarlijks zijn eigen geconstrueerde TFP’s. Het meten van technische
vooruitgang is een pragmatische methode die het mogelijk maakt om snel en
internationaal vergelijkend onderzoek te doen, maar het blijft een
onbevredigende methode, die bovendien misleidend kan zijn als je niet alle
ins en outs kent wat er achter de constructie van dit soort getallen schuil
gaat. Niet voor niets riep Robert Solow - de grootvader van de TFP-berekening tevens in bezit van een immer onafhankelijke geest - al in 1987: “You can see the computer age everywhere but in the productivity statistics.”
Zonder die kennis leiden TFP-berekeningen tot overdreven pessimisme. Voor je het
weet is er weer een initiatief om een topsectorenbeleid 2.0 in het leven te
roepen (zie o.a. Brakman en Garretsen (2012) waarom dit geen goed idee is). En, als we eerlijk en symmetrisch denken moeten we misschien ook ons optimisme over de TFP-groei in de wederopbouwperiode na de Tweede Wereldoorlog inslikken. Als we corrigeren voor de maatschappelijke kosten van vroegere innovaties met onbedoelde sociale kosten, dan waren die geroemde gouden groei-jaren helemaal niet zo goud. Anders gezegd, de ware maatschappelijke kosten van innovaties in die wederopbouwjaren zijn onderschat omdat die kosten nooit meegenomen werden in de nationale boekhouding, en toekomstige generaties - in het geval van de gouden naoorlogse jaren: zij die nu leven - zullen de rekening daarvoor moeten ophoesten. Het is een probleem dat onlosmakelijk verbonden is met innovaties die bedoelde én onbedoelde effecten sorteren. Denk aan DDT, een insecticide die vanaf de jaren veertig ziektes als malaria en tyfus en vele andere beheersbaar maakte en op grote schaal in het milieu werd gebracht. Pas later in de jaren zestig werd de schadelijke werking van DDT ontdekt en in in 1972 werd het verboden. Het gebruik van CFKs in koelkasten en drijfgas in spuitbussen kende ook een soortgelijk opgang en neergang toen werd aangetoond dat het de ozonlaag vernietigde.
Het voorstellingsvermogen van innovators schiet precies op het punt van onbedoelde effecten tekort. De enorme kosten komen pas jaren na de uitvinding bovendrijven (Mokyr, 2018). De groeiboekhoudindustrie heeft helaas niet de verbeeldingskracht gehad om dit goed aan te pakken en te meten. Het lijkt dan ook een
veilige voorspelling om te zeggen dat we voortdurend zullen laveren tussen overmatig optimisme en pessimisme over vooruitgang zolang er niet een radicaal andere
meting van technische vooruitgang komt.
Als we corrigeren voor de maatschappelijke kosten van vroegere innovaties met onbedoelde sociale kosten, dan waren die geroemde gouden groei-jaren helemaal niet zo goud.
Zelf ben ik een fan van het werk van Nobelprijswinnaar Nordhaus (1997a) die
met zijn baanbrekende analyse over de prijs van licht door de eeuwen heen
een steen in de vijver wierp in het vakgebied van het meten van vooruitgang. Om een lang verhaal kort te maken: we moeten ons
niet gek laten maken door de prijsstatistieken van statistische bureaus
omdat de werkelijke bijdrage van technische vooruitgang die tot uiting komt
in bepaalde goederen niet mee wordt genomen. Als je daarvoor
corrigeert, zoals Nordhaus deed voor het goed ‘licht’, onderschatten we de
technische vooruitgang met een factor 1000. De impliciete boodschap van
Nordhaus is: ga eens onderzoek doen naar een echt product en probeert eens
te kwantificeren hoeveel vooruitgang we over de tijd hebben geboekt. En die
aanpak, zo laat het werk van Nordhaus zien, vergt niet het downloaden van
een tijdreeks, maar grondig historisch onderzoek. Wat hebben antropologen
te zeggen over licht en vuur en hoe doelmatig waren licht-producerende
apparaten, van kaarsen tot gloeilampen? Soms moest hij zelf een meting doen en
verbrandde hij tien kilo hout in zijn eigen open haard om het aantal
lumen licht van vuur te meten. Onderzoek dat begon in 1974 met
de vraag hoe de energiecrisis van invloed was op het tempo van technische
vooruitgang leidde uiteindelijk drieëntwintig jaar later tot een publicatie in 1997.
Hoe mooi
kan ‘slow science’ zijn en wie durft zijn voorbeeld te volgen? Hij
bekritiseerde en passant ook de productiviteitsmeting in de traditionele
statistieken, maar helaas tot nu toe zonder resultaat (Nordhaus, 1997b). Misschien zegt
dat 'falen' ook wel iets over het succes van het idee van nationaal boekhouden en
het BBP, ideeën die zich niet makkelijk laten verdringen om begrijpelijke
en praktische redenen. Maar dan is het de taak als wetenschapper om altijd kritisch te
blijven, en is een kritische vragensteller en onderzoeker als Nordhaus des te meer welkom. Hij
laat zien dat je niet alleen een creatief brein en een lange adem moet
hebben in de wetenschap - maar ook een vraag stelt die er toe doet.
Wie in een ‘schaakclub’ zit, zoals de hierboven geciteerde econoom, zal
nooit veel vooruitgang opmerken of produceren, het spel is immers
belangrijker dan de knikkers. Toch stemt dat triest, omdat het barst van de
transities en problemen in deze wereld die om een antwoord smeken. En alle
creativiteit is daarom geboden om de kennis die in de wetenschap verstopt
zit op te diepen om die transities in goede banen te leiden. Blijf dus weg van
het ‘schaken’ en probeer eens groots te denken. En als groots denken niet lukt, denk dan in ieder geval eens groter dan je normaal doet.
Literatuur:
Abramovitz, M. (1956), Resource and Output Trends in the United States Since 1870, American Economic Review, 46, 5-23.
Abramovitz, M. (1993). The search for the sources of growth: areas of ignorance, old and new,The Journal of Economic History, 53(2), 217-243.
Akerlof, G.A. (2020), Sins of Omission and the Practice of Economics, Journal of Economic Literature, 58(2), 405-418.
Bloom, N., C.I. Jones, J. Van Reenen, en M. Webb, (2020), Are ideas getting harder to find?, American Economic Review, 110(4), 1104-1144.
Brakman, S., en H. Garretsen (2012), Het misleidende denken in top- en flopsectoren, Me Judice, 4 december 2012.
Chu, J.S., en J.A. Evans, (2021). Slowed canonical progress in large fields of science, Proceedings of the National Academy of Sciences,
118(41), e2021636118.
Dalen, H.P. van (2021), How the publish-or-perish principle divides a science: The case of
economists, Scientometrics, 126(2), 1675-1694.
Dalen, H.P. van, en K. Henkens, (2012), Intended and unintended consequences of a publish‐or‐perish culture: A
worldwide survey, Journal of the American Society for Information Science and Technology
, 63(7), 1282-1293.
Heckman, J.J., en S. Moktan, (2020), Publishing and promotion in economics: The tyranny of the top five, Journal of Economic Literature
, 58(2), 419-70.
Kerr, S. (1975). On the folly of rewarding A, while hoping for B. Academy of Management Journal, 18(4), 769–783.
Mokyr, J. (2018), The past and the future of innovation: Some lessons from economic history, Explorations in Economic History, 69, 13-26.
Nordhaus, W.D. (1997a). Do real wage and output series capture reality? The
history of lighting suggests not. In: The Economics of New Goods, Chicago
University Press. Chicago.
Nordhaus, W.D. (1997b), Traditional productivity estimates are asleep at the (technological) switch, Economic Journal, 107(444), 1548-1559.
Osterloh, M., en B.S. Frey, (2015). Ranking games. Evaluation Review, 39(1), 102–129.
Packalen, M., en J. Bhattacharya, (2020), NIH funding and the pursuit of edge science. Proceedings of the National Academy of Sciences,
117(22), 12011-12016.
Reay, M. (2007), Academic knowledge and expert authority in American economics, Sociological Perspectives, 50(1), 101-129.
Solow, R.M., (1987),
We'd better watch out
, New York Times Book Review, 12 juli 1987, p. 36.