Open this publication in new window or tab >>2020 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
The transition of camera technology from film-based cameras to digital cameras has been witnessed in the past twenty years, along with impressive technological advances in processing massively digitized media content. Today, a new evolution emerged -- the migration from 2D content to immersive perception. This rising trend has a profound and long-term impact to our society, fostering technologies such as teleconferencing and remote surgery. The trend is also reflected in the scientific research community, and more intention has been drawn to the light field and its applications.
The purpose of this dissertation is to develop a better understanding of light field structure by analyzing its sampling behavior and to addresses three problems concerning the light field processing pipeline: 1) How to address the depth estimation problem when there is limited color and texture information. 2) How to improve the rendered image quality by using the inherent depth information. 3) How to solve the interdependence conflict of demosaicing and depth estimation.
The first problem is solved by a hybrid depth estimation approach that combines advantages of correspondence matching and depth-from-focus, where occlusion is handled by involving multiple depth maps in a voting scheme. The second problem is divided into two specific tasks -- demosaicing and super-resolution, where depth-assisted light field analysis is employed to surpass the competence of traditional image processing. The third problem is tackled with an inferential graph model that encodes the connections between demosaicing and depth estimation explicitly, and jointly performs a global optimization for both tasks.
The proposed depth estimation approach shows a noticeable improvement in point clouds and depth maps, compared with references methods. Furthermore, the objective metrics and visual quality are compared with classical sensor-based demosaicing and multi-image super-resolution to show the effectiveness of the proposed depth-assisted light field processing methods. Finally, a multi-task graph model is proposed to challenge the performance of the sequential light field image processing pipeline. The proposed method is validated with various kinds of light fields, and outperforms the state-of-the-art in both demosaicing and depth estimation tasks.
The works presented in this dissertation raise a novel view of the light field data structure in general, and provide tools to solve image processing problems in specific. The impact of the outcome can be manifold: To support scientific research with light field microscopes, to stabilize the performance of range cameras for industrial applications, as well as to provide individuals with a high-quality immersive experience.
Abstract [sv]
Under de senaste tjugo åren har det skett en övergång från filmbaserad till digital kamerateknik, parallellt med en imponerande teknisk utveckling inom bearbetning av omfattande digitaliserat medieinnehåll. På senare tid även en ny utvecklingslinje – övergången från 2D-innehåll till omslutande perception. Detta är en utveckling som har långtgående och långvarig påverkan på samhället och främjar arbetsmetoder såsom telekonferens och fjärrstyrd kirurgi. Den här utvecklingst trenden återspeglas också i det vetenskapliga forskningssamhället, och mer uppmärksamhet har lagts på light field och dess olika tillämpningsområden.
Syftet med avhandlingen är att nå en bättre förståelse av strukturen i light field genom att analysera hur light field samplas, och att lösa tre problem inom behandlingsprocessen av light field: 1) Hur problemet med djupestimering kan lösas med begränsad information om färg och textur. 2) Hur renderad bildkvalitet kan förbättras genom att utnyttja den inneboende djupinformationen. 3) Hur beroendekonflikten mellan demosaicing (färgfiltrering) och djupestimering kan lösas.
Det första problemet har lösts genom en hybridmetod för djupestimering, som kombinerar styrkorna med korrespondensmatchning och djup från fokus, där ocklusion hanteras genom att använda flera djupkartor i ett röstningssystem. Det andra problemet delas upp i två separata moment – demosaicing och superupplösning, där djupassisterad analys av light field används för att överträffa kapaciteten för traditionell bildbehandling. Det tredje problemet har angripits med en inferentiell grafmodell som explicit kopplar samman demosaicing och djupestimering, och samfällt utför en global optimering för båda dessa processteg.
Den metod för djupestimering som föreslås producerar visuellt tilltalande punktmoln och djupkartor, jämfört med andra referensmetoder. Objektiva mätvärden och visuell kvalitet jämförs vidare med klassisk sensorbaserad demosaicing och superupplösning från multipla bilder, för att visa effektiviteten hos de föreslagna metoderna för djupassisterad behandling av light field. En multitaskande grafmodell föreslås även för att matcha och överträffa prestandan hos sekventiell light field-baserad bildbehandling. Den metod som föreslås valideras med olika sorters light fields och överträffar de bästa existerande metoderna inom både demosaicing och djupestimering.
De arbeten som presenteras i avhandlingen utgör ett nytt sätt att betrakta den generella datastrukturen hos light field, och tillhandahåller verktyg för att lösa specifika bildbehandlingsproblem. Effekterna av dessa resultat kan vara många, till exempel som stöd för vetenskaplig forskning om light field-baserade mikroskop, för att förbättra prestandan hos avståndsmätande kameror i industriella tillämpningar, såväl som för att erbjuda högkvalitativa omslutande mediaupplevelser.
Place, publisher, year, edition, pages
Sundsvall: Mid Sweden University, 2020. p. 56
Series
Mid Sweden University doctoral thesis, ISSN 1652-893X ; 327
Keywords
Light field, computational photography, depth estimation, demosaicing, super-resolution
National Category
Computer and Information Sciences
Identifiers
urn:nbn:se:miun:diva-39005 (URN)978-91-88947-57-4 (ISBN)
Public defence
2020-06-10, C312, Holmgatan 10, Sundsvall, 09:00 (English)
Opponent
Supervisors
Projects
European Unions Horizon 2020 under the Marie Sklodowska-Curie grant agreement No 676401, European Training Network on Full Parallax Imaging
Note
Vid tidpunkten för disputationen var följande delarbeten opublicerade: delarbete 4 manuskript och delarbete 5 inskickat.
At the time of the doctoral defence the following papers were unpublished: paper 4 manuscript and paper 5 submitted.
2020-05-182020-05-112020-05-13Bibliographically approved