\documentclass[12pt]{article}
\usepackage{amsmath}
\usepackage{xepersian}
\settextfont{XB Zar}
\settextfont{Yas}
\setdigitfont{Yas}
\linespread{1.25} 
\newtheorem{definition}{تعریف}[section]
\newtheorem{theorem}[section]{قضیه}
\newcommand{\dd}{\,\mathrm{d}}
\newcommand{\ee}{\,\mathrm{d}}
\newtheorem{example}{مثال }[section]
\newtheorem{remark}{تذکر}[section]
\settextfont[Scale=1.1]{Yas}
\begin{document}      
\textbf{\huge  توابع محدب}
 \section{ویژگیها و نمونه‌های پایه}
 \subsection{تعریف}


تابع$f:R^n\rightarrow R$محدب است اگر$domf$یک مجموعه محدب و اگر برای همه$x,y\in dom f $ باشد،و$\theta$  با$0\leq\theta\leq1$  داریم

\begin{equation}
f(\theta x+(1-\theta)y\leq\theta f(x)+(1-\theta)f(y).
\end{equation}


به لحاظ هندسی،این نابرابری به این معنی است که پاره‌خط بین$(x,f(x))$و$(y,f(y))$ که این وتر از$x$  به$y$  است در بالای این نمودار از $f$ قرار می‌گیرد(شکل(۱.۳)).تابعی از $f$ که صرفاٌ محدب است اگر دارای نابرابری محض در(۱.۳) باشد هر‌وقت که $x\neq y$ و$0<\theta<1$.گفتیم $f$ مقعر است اگر $f$محدب باشد و اگر$f$ شدیدا محدب باشد $f$ شدیدا مقعر است.برای یک تابع معین همیشه در (3.1) برابری داریم،بنابراین تمام توابع معین ( و در نتیجه توابع خطی نیز) هم مقعر و هم محدب هستند.بالعکس هر تابع که محدب و مقعرباشد معین است.یک تابع محدب است اگر وتنها اگر زمانی‌که به هر خط که دامنه‌ی آن را قطع میکند محدود شد آن محدب است.یعنی $f$ محدب است اگر و تنها اگر برای همه $x\in dom f$ و 
شکل 3.1.نمودار یک تابع محدب . وتر (یعنی پاره خط) بین هر دو نقطه بر روی نمودار در بالای این نمودار قرار دارد.
تمام $\upsilon$ تابع $g(t)=f(x+t\upsilon)$ محدب است (بر روی دامنه‌ی آن $\lbrace t|x+t\upsilon\in dom f\rbrace$).این ویژگی خیلی مفید است،چون به ما اجازه می‌دهد که بررسی کنیم آیا‌ تابعی بوسیله‌ی محدود کردن آن به یک خط،محدب است.تجزیه و تحلیل توابع محدب رشته توسعه یافته خوبی است،که در هر عمقی پیگیری نمیکنیم.یک نتیجه ساده،بعنوان مثال،این است که یک تابع محدب در فضای داخلی نسبی از دامنه‌ی آن پیوسته است;می‌تواند ناپیوستگی تنها در مرز نسبی آن داشته باشد.


\subsection{پسوندهای مقدار توسعه یافته}


اغلب برای گسترش یک تابع محدب برای تمام $R^n$ با تعریف مقدار آن که $\infty$ خارج از دامنه آن باشد،مناسب است. اگر f محدب باشد پسوند مقدار توسعه یافته آن را $\tilde{f}$تعریف می‌کنیم    $\tilde{f}:R^n\rightarrow R\cup\lbrace\infty\rbrace$ با
\[
\tilde{f}=
\begin{cases}
f(x) & x\in dom f\\
\infty & x\notin dom f.
\end{cases}
\]
پسوند $\tilde{f}$ برای تمام $R^n$، تعریف می‌شود و مقادیری در $R\cup\lbrace\infty\rbrace$ میگیرد.می‌توانیم دامنه تابع  اصلی $f$از پسوند $\tilde{f}$ دوباره بدست آوریم بطوریکه $dom f=\lbrace x|\tilde{f}(x)<\infty\rbrace$.این پسوند می‌تواند علامت‌گذاری را ساده کند،چون آشکارا  نباید این دامنه را توصیف کنیم، یا مقدماتی برای تمام $x\in dom f$ هر وقت که به $f(x)$،مراجعه می‌کنیم اضاافه کنیم.برای مثالنابرابری تعریف پایه (3.1) را در نظر بگیرید، به لحاظ پسوند $\tilde{f}$ می‌توانیم آن را بیان کنیم مانند: برای $0<\theta<1$.
\[
\tilde{f}(\theta x+(1-\theta)y)\leq\theta\tilde{f}(x)+(1-\theta)\tilde{f}(y)
\]
برای هر$x$ و$y$ .( برای $\theta=0$ یا $\theta=1$ همیشه دارای این نابرابری است.)البته در این کتاب باید این نابرابری را با استفاده از محاسبات گسترده و مرتب‌سازی بیان کنیم.برای $x$  و $y$  هر دو در $dom f$ این نابرابری مقارن است با (3.1).درصورتی که هر دو خارج  $dom f$ باشد،پس سمت راست $\infty$ است،بنابراین این نابرابری را دارا است.بعنوان مثال دیگر از این شیوه علامت‌گذاری فرض کنید $f_1$ و $f_2$دو تابع محدب این روی $R^n$ است. مجموع نقطه به نقطه $f=f_1+f_2$ تابع با دامنه $dom f=dom f_1\cap dom f_2$، با $f(x)=f_1(x)+f_2(x)$ برای هر $x\in dom f$است.با استفاده از پسوندهای مقدار گسترده به سادگی می‌توانیم بگوییم برای هر $\tilde{f}(x)=\tilde{f_1}(x)+\tilde{f_2}(x)$. در این معادله دامنه $f$ بطور خودکار بعنوان $dom f=dom f_1\cap dom f_2$تعریف شده است،چون $\tilde{f}(x)=\infty$ هروقت $x\notin dom f_1$ یا $x\notin dom f_2$.در این کتاب همان علامت را برای نشان دادن یک تابع محدب و پسوند آن بکار می‌بریم ،هر وقت هیچ زیانی از این ابهام وجود نداشته باشد. این همان است که همانطور که فرض شد که تمام توابع محدب بطور ضمنی گسترش داده در این مثال بر محاسبات گسترده که بطور خودکار این دامنه را تعریف می‌کند تکیه می‌کنیم.در می‌شوند یعنی بعنوان $\infty$ خارج از دامنه شان تعریف می‌شوند.
\begin{example}
شاخص تابع یک مجموعه محدب.فرض کنید $C\subseteq R^n$،یک مجموعه محدب باشد و تابع (محدب) $I_c$ را با دامنه $c$ و $I_c(x)=0$ برای تمام $x\in C$ درنظر بگیرید،یعنی این تابع در مجموعه $C$ عیناٌ صفر است.پسوند مقدار گسترده آن. 
\end{example}
شکل3.2.اگر f محدب و مشتق پذیر باشد ،پس $f(x)+\bigtriangledown f(x)^T(y-x)\leq f(y)$برای تمام $x,y\in dom f$.
داده می‌شود با:
\[
\tilde{I_c}(x)=
\begin{cases}
0 ,& x\in C\\
\infty ,& x\notin C.
\end{cases}
\]
تابع محدب $\tilde{I_c}$ شاخص تابع مجموعه $C$ نامیده می‌شود.می‌توانیم چند ترفند را با شاخص تابع $\tilde{I_c}$ بکار ببریم.مثلا مسئله‌ی به حداقل رساندن یک تابع $f$ (تعریف شده برای تمام $R^n$،می‌گویند) بر مجموعه $C$ همان به حداقل رساندن تابع $f+\tilde{I_c}$ بر تمام $R^n$است.درواقع,تابع $f+\tilde{I_c}$ (با کنوانسیونمان) $f$ محدود شده به مجموعه $C$ است. در روشی مشابه می‌توانیم تابعی مقعر را با تعریف آن گسترش دهیم تا $-\infty$ خارج از دامنه آن باشد.

\subsection{شرایط مرتبه اول}

فرض کنید $f$ مشتق‌پذیر  باشد ( یعنی شیب آن $\bigtriangledown f$ در هر نقطه در $dom f$ وجود دارد که باز است).پس $f$ محدب است اگر‌وتنها‌اگر $dom f$ محدب باشد و 

\begin{equation}
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x)
\end{equation}

برای تمام $x,y\in dom f$حفظ می‌کند.این نابرابری در شکل 3.2 نشان داده می‌شود.تابع معین $y$ با $f(x)+\bigtriangledown f(x)^T(y-x)$ داده شده ،البته تقریب تیلور  مرتبه اول $f$ نزدیک $x$ است.نابرابری (3.2)بیان می‌کند که برای یک تابع محدب ،تقریب تیلور مرتبه اول در واقع تحت براوردگر جهانی تابع است.برعکس ،اگر تقریب تیلور مرتبه اول یک تابع همیشه تحت براوردگر جهانی تابع باشد ،پس تابع محدب است.نابرابری (3.2) اطلاعات محلی درباره یک تابع محدب را نشان می‌دهد (یعنی مقدار و مشتق ان در یک نقطه) می‌توانیم اطلاعات جهانی را استنتاج کنیم(یعنی تحت براوردگر جهانی ان).شاید این مهمترین ویژگی توابع محدب باشد، و برخی ویژگیهای قابل توجه توابع محدب و مسائل بهینه‌سازی محدب را توضیح می‌دهد.بعنوان یک مثال ساده،نابرابری  (3.2)نشان می‌دهد اگر $\bigtriangledown f(x)=0$پس برای تمام $y\in dom f$ ،$f(y)\geq f(x)$یعنی $x$ یک کوچک شمار جهانی تابع $f$ است.محدب شدیدا نیز می‌تواند با یک شرط مرتبه اول مشخص شود:$f$ به شدت محدب است اگر‌و‌تنها‌اگر $dom f$محدب است و برای $x,y\in dom f$ و$x\neq y$ ،داریم 

\begin{equation}
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x)
\end{equation}


برای توابع مقعر خصوصیات متناظر داریم:$f$ مقعر است اگر‌وتنها‌اگر $dom f$ محدب باشد و 


\[
f(y)\leq f(x)+\bigtriangledown f(x)^T(y-x)
\]

                                 
برای تمام $x,y\in dom f$.
\chapter*{اثبات شرط محدب درجه اول}

برای ثابت کردن (3.2)، اول حالت $n=1$ را درنظر می‌گیریم:تابع مشتق‌پذیر $f:R\rightarrow R$محدب است اگر‌و تنها‌اگر 

\begin{equation}
f(y)\geq f(x)+f‌‌‌‌‌'(x)(y-x)
\end{equation}

برای تمام $x$ و $y$ در $dom f$.اول فرض کنید که $f$ محدب است و $x,y\in dom f$.چون $dom f$ محدب است (یعنی یک فاصله),نتیجه می‌گیریم که برای تمام $0<t\leq 1$، $x+t(y-x)\in dom f$ و به وسیله‌ی تحدب $f$،

\[
f(x+t(y-x))\leq (1-t)f(x)+tf(y).
\]

اگر هر دو سمت را به $t$ تقسیم کنیم ،به دست می‌آوریم

\[
f(y)\geq f(x)+\frac{f(x+t(y-x))-f(x)}{t},
\]

و با گرفتن حد به عنوان بازده $t\rightarrow o$.

برای نشان دادن قابلیت ،فرض کنید این تابع (3.4) را برای تمام  $x$ و $y$ در $dom f$ برآورده کند (که یک فاصله است). هر $x\neq y$،و $0\leq \theta\leq 1$،را انتخاب کنید و فرض کنید $z=\theta x+(1-\theta)y$. با دو برابر بازدهی 

\[
f(x)\geq f(z)+f'(z)(x-z),\qquad f(y)\geq f(z)+f'(z)(y-z).
\]

با ضرب کردن اولین نابرابری با $\theta$، و دومین نابرابری با $1-\theta$،و با اضافه کردن آنها به بازده

\[
\theta f(x)+(1-\theta)f(y)\geq f(z),
\]

که ثابت می‌کند $f$ محدب است.حالا می‌توانیم از دیدگاه کلی ثابت کنیم ،با $f:R^n\rightarrow R$.فرض کنید $x,y\in R^n$ و در نظر بگیرید $f$ به خطی که از میان آنها می‌گذرد محدود شده یعنی این تابع تعریف شده با 

\[
g(t)=f(ty+(1-t)x), so\quad g'(t)=\bigtriangledown f(ty+(1-t)x)^T(y-x).
\]

اول فرض کنید $f$ محدب است،که اشاره دارد $g$
 محدب است،پس با استدلال بالا داریم $g(1)\geq g(0)+g'(0)$ به این معنی که                         

\[
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x).
\]

حالا فرض کنید که این نابرابری را برای هر $x$ و $y$ حفظ می‌کند،پس اگر $ty+(1-t)x\in dom f$   و $\tilde{t}y+(1-\tilde{t})x\in dom f$،داریم 

\[
f(ty+(1-t)x\geq f(\tilde{t}y+(1-\tilde{t})x)+\bigtriangledown f(\tilde{t}y+(1-\tilde{t})x)^T(y-x)(t-\tilde{t}),
\]

یعنی $g(t)\geq g(\tilde{t})+g'(\tilde{t})(t-\tilde{t})$. دیدیم که این نشان می‌دهد که $g$ محدب است.
\subsection{شرایط مرتبه دوم}

حالا فرض می‌کنیم که $f$ دو بار مشتق‌پذیر است‌،یعنی هسیین آن یا مشتق دوم $\bigtriangledown^2f$ در هر نقطه در $dom f$ وجود دارد،که باز است.پس $f$ محدب است اگر‌و‌تنها‌اگر $dom f$ محدب باشد و هسیین آن نیمه معین مثبت است: برای تمام $x\in dom f$،

\[
\bigtriangledown^2f(x)\succeq 0.
\]
برای تابعی بر روی $R$،این به شرط ساده $f''(x)\geq 0$ساده می‌شود (و $dom f$محدب،یعنی  یک فاصله)،که به این معنی است که مشتق غیر‌کاهشی است.این شرط $\bigtriangledown^2f(x)\succeq 0$ می‌تواند به لحاظ هندسی بعنوان نیاز تفسیر شود که نمودار تابع انحنای مثبت (رو به بالا)در $x$ دارد.اثبات شرطمرتبه دوم را بعنوان یک تمرین رها می‌کنیم (تمرین 3.8).به همین ترتیب،$f$مقعر است اگر‌وتنها‌اگر $dom f$محدب باشد و $\bigtriangledown^2f(x)\preceq 0$ برای تمام $x\in dom f$ .تحدب شدید می‌تواند تاحدی با شرایط مرتبه دوم مشخص شود.اگر $\bigtriangledown^2f(x)\succ 0$ برای تمام $x\in dom f$،پس $f$ شدیدا محدب است.با این حال معکوس این درست نیست:مثلا،تابع $f:R\rightarrow R$داده می‌شود با $f(x)=x^4$ شدیدا محدب است اما در $x=0$ مشتق دوم صفر دارد.
\begin{example}

توابع درجه دوم.تابع درجه دوم $f:R^n\rightarrow R$ را با $f=R^n$ در نظر بگیرید،داده می‌شود با 

\[
f(x)=(1/2)x^TPx+q^Tx+r,
\]

با$P\in S^n$,$q\in R^n$ و $r\in R$ .از آنجائیکه $\bigtriangledown^2f(x)=P$برای تمام $x$،$f$ محدب است اگرو‌تنها‌اگر $P\succeq 0$(و مقعر است اگر‌و‌تنها‌اگر $P\preceq 0$).برای توابع درجه دوم،تحدب شدید بسادگی مشخص می‌شود:$f$ شدیدا محدب است اگر‌و‌تنها‌اگر $P\succ 0$(و شدیدا مقعر است اگر‌و‌تنها‌اگر $P\prec 0$).
\end{example}
\begin{remark}
شرط جداگانه که $dom f$ محدب باشد نمی‌تواند از مشخصه‌های مرتبه اول و دوم تحدب و تقعر کاهش یابد.مثلا،تابع .$f(x)=1/x^2$ با $dom f=\lbrace x\in R|x\neq 0\rbrace $،$f''(x)>0$ را برای تمام $x  
\in dom f$،براورده می‌کند،اما یک تابع محدب نیست.
\end{remark}
\subsection{مثالها}

قبلا گفتیم که همه توابع خطی و پیوسته محدب هستند(و مقعر)،و محدب و مقعر توابع درجه دوم را شرح دادیم.در این بخش به چند نمونه از توابع محدب و مقعر می‌پردازیم.با برخی توابع در $R$،با متغیر $x$ شروع می‌کنیم.


\begin{itemize}
\item\textbf{نمایی:} $e^{ax}$ در $R$, برای هر $a\in R$ محدب است.
\item\textbf{توانها:} $x^a$ در $R_{++}$ محدب است زمانیکه $a\geq 1$ یا $a\leq 0$,و مقعر است برای $0\leq a\leq 1$.
\item\textbf{توانهای قدر مطلق:}  $|x|^p$,برای $p\geq 1$,در $R$ محدب است.
\item\textbf{لگاریتم:}   $log\:x$ در$R_{++}$ مقعر است.
\item\textbf{آنتروپی منفی:}  $x\:log\:x$ (یا در $R_{++}$ یا در $R_+$ به عنوان $0$ تعریف می‌شود برای $x=0$) محدب است.
\end{itemize}


تحدب یا تقعر این نمونه‌ها با اثبات نابرابری اولیه (3.1) یا با بررسی مشتق دوم،غیر‌منفی یا غیر‌مثبت است را می‌تواند نشان دهد . مثلا،با $f(x)=x\:log\:x$ داریم 

\[
f'(x)=log\:x+1,\qquad f''(x)=1/x,
\]

بطوریکه $f''(x)>0$ برای $x>0$ . این نشان می‌دهد که تابع آنتروپی منفی (شدیداٌ) محدب است.حالا چند نمونه جالب از توابع را در $R^n$ می‌دهیم.

\begin{itemize}
\item\textbf{نرمها :}  هر نرم در $R^n$ محدب است.
\item\textbf{توابع $max$ :}  $f(x)=max\lbrace x_1,\ldots,x_n\rbrace$ در $R^n$ محدب است.
\item\textbf{تابع درجه دوم بر تابع خطی :}  تابع $f(x,y)=x^2/y$، با

\[
dom f=R\times R_{++}=\lbrace (x,y)\in R^2|y>0\rbrace,
\]
محدب است (شکل ۳).
\item\textbf{لگاریتم ـ مجموع ـ تابع نمایی :}  تابع $f(x)=log(e^x_1+\cdots+e^x_n)$ در $R$ محدب است.
این تابع می‌تواند بعنوان یک تقریب مشتق‌پذیر (در واقع،تحلیلی) از تابع $max$ تفسیر شود،چون

\[
max\lbrace x_1,\ldots,x_n\rbrace\leq f(x)\leq max\lbrace x_1\ldots x_n\rbrace+log\: n
\]

برای تمام $x$.(زمانیکه تمام اجزای $x$ برابر هستند،نابرابری دوم برقرار است.)شکل 4، $f$ را برای $n=2$ نشان می‌دهد.
\item\textbf{میانگین هندسی:} میانگین هندسی  $f(x)=(\prod_{i=1}^n x_i)^{1/n}$ در $dom f=R_{++}^n$ مقعر است.
شکل۳.۴:گراف $f(x,y)=log(e^x+e^y)$.
\item\textbf{لگاریتم ـ دترمینان :}  تابع $f(\mathbf{x})=log\: det\:\mathbf{x}$ در $dom f=S_{++}^n$ مقعر است.
تحدب (یا تقعر) این نمونه‌ها می‌تواند به چند روش اثبات شود،مانند اثبات نابرابری بطور مستقیم (3.1)،اثبات این که هسیین نیمه معین مثبت است،یا با محدود کردن این تابع به یک خط دلخواه و اثبات تحدب تابع به دست آمده از یک متغیر.

\end{itemize}
\textbf{نرمها.} اگر $f:R^n\rightarrow R$ یک نرم باشد،و $0\leq \theta\leq 1$,

\[
f(\theta x+(1-\theta)y)\leq f(\theta x)+f((1-\theta)y)=\theta f(x)+(1-\theta)f(y).
\]
نابرابری به شرح زیر از نابرابری مثلث،و برابری به شرح زیر از یکنواختی یک نرم.


\textbf{تابع حداکثر.} تابع $f(x)=max_i x_i$ برای $0\leq\theta\leq 1$,
\begin{align*}
f(\theta\:x+(1-\theta)y) & =\underset{i}{max}(\theta x_i+(1-\theta)y_i)\\
& \leq \theta\:\underset{i}{max}\:x_i+(1-\theta)\underset{i}{max}\:y_i\\
&=\theta f(x)+(1-\theta)f(y).
\end{align*}


\textbf{تابع مرتبه دوم بر تابع خطی.} برای نشان دادن اینکه تابع مرتبه دوم بر خطی $f(x,y)=x^2/y$ محدب است،توجه داشته باشید که (برای$y>0$)،


\[
\bigtriangledown^2 f(x,y)=\frac{2}{y^3}\begin{bmatrix}
y^2 & -{xy}\\
-{xy} & x^2\\
\end{bmatrix}
=\frac{2}{y^3}\begin{bmatrix}
y\\
-x\\
\end{bmatrix}
\begin{bmatrix}
y\\
-x\\
\end{bmatrix}
^T
\succeq 0.
\]


\textbf{لگاریتم ـ مجموع ـ نمایی.} هسیین تابع $(log-sum-exp)$ هست;

\[
\bigtriangledown^2 f(x)=\frac{1}{(1^Tz)^2}((1^Tz) diag(z)-zz^T),
\]
که $z=(e^{x_1},\ldots,e^{x_n})$. به منظور بررسی $\bigtriangledown^2 f(x)\succeq 0$ باید نشان دهیم که برای تمام $\upsilon$، $\upsilon^T\bigtriangledown^2 f(x)\upsilon\geq 0$ یعنی 

\[
\upsilon^T\bigtriangledown^2 f(x)\upsilon=\frac{1}{(1^Tz)^2}\left(
\left(
\sum_{i=1}^n z_i\\
\right)
\left(
\sum_{i=1}^n\upsilon_i^2 z_i\\
\right)
-\left(
\sum_{i=1}^n\upsilon_i z_i\\
\right)
^2\\
\right)
\geq 0.
\]
اما این اصل از نابرابری کوشی ـ شوارتز$(a^T a)(b^T b)\geq(a^Tb)^2$  برای بردارها با اجزا $a_i=\upsilon_i\sqrt{z_i}$ ، $ b_i=\sqrt{z_i}$ بکار برده شد.


\textbf{میانگین هندسی.} در روشی مشابه می‌توانیم نشان دهیم که میانگین هندسی $f(x)=(\prod_{i=1}^n x_i)^{1/n}$ در $dom f=R_{++}^n$ مقعر است.هسیین آن $\bigtriangledown^2 f(x)$ داده می‌شود با 

\[
\frac{\partial^2 f(x)}{\partial x_k^2}=-(n-1)\frac{(\prod_{i=1}^n x_i)^{1/n}}{n^2 x_k^2},\qquad\frac{\partial^2 f(x)}{\partial x_k\partial x_l}=\frac{(\prod_{i=1}^n x_i)^{1/n}}{n^2 x_k x_l}\qquad for\quad k\neq l,
\]

و می‌تواند بیان شود به عنوان

\[\bigtriangledown^2 f(x)=-\frac{\prod_{i=1}^n x_i^{1/n}}{n^2}(n diag(1/x_1^2,ldots,1/x_n^2)-qq^T)
\]
که $q_i=1/x_i$.باید نشان دهیم که .$\bigtriangledown^2 f(x)\preceq 0$،یعنی،که 

\[
\upsilon^T\bigtriangledown^2 f(x)\upsilon=-\frac{\prod_{i=1}^n x_i^{1/n}}{n^2}\left(
n\sum_{i=1}^n\upsilon_i^2/x_i^2-\left(
\sum_{i=1}^n\upsilon_i/x_i
\right)^2
\right)
\leq 0
\]
برای تمام $\upsilon$ .دوباره این اصل از نابرابری کوشی شوارتز $(a^T a)(b^T b)\geq(a^Tb)^2$ برای بردارهای $a=1$ و $b_i=\upsilon_i/x_i$ به کار برده شده.

\textbf{لگاریتم ـ دترمینان.} برای تابع $f(\mathbf{x})=log\;det\mathbf{x}$،می‌توانیم تقعر را با درنظر گرفتن یک خط دلخواه اثبات کنیم
،داده شده با $\mathbf{x}=Z+tV$،که $Z,V\in S^n$ . تعریف می‌کنیم $g(t)=f(Z+tV)$،و $g$ را محدود می‌کنیم که فاصله مقادیر $t$ که برای $Z+tV\succ 0$.
بدون از دست دادن کلیت،می‌توانیم فرض کنیم که $t=0$ داخل این فاصله است،یعنی $Z\succ 0$ . داریم


\begin{align*}
g(t) & =log\;det(Z+tV)\\
& =log\;det(Z^{1/2}(I+tZ^{-1/2}VZ^{-1/2})Z^{1/2})\\
& =\sum_{i=1}^n log(1+t\lambda_i)+log\;det Z\\
\end{align*}

که $\lambda_1,\ldots,\lambda_n$ مقادیر ویژه $Z^{-1/2}VZ^{-1/2}$.بنابراین داریم

\[
g'(t)=\sum_{i=1}^n\frac{\lambda_i}{1+t\lambda_i}\:,\qquad g''(x)=-\sum_{i=1}^n\frac{\lambda_i^2}{(1+t\lambda_i)^2}.
\]

از آنجائیکه $g''(t)\leq 0$،نتیجه می‌گیریم که $f$ مقعر است.

\subsection{زیرمجموعه‌ها}

 مجموعه $\alpha$-زیر‌سطح تابع $f:R^n\rightarrow R$ تعریف می‌شود به عنوان  
\[
C_\alpha=\lbrace x\in\textbf{dom} f|f(x)\leq \alpha\rbrace.
\]                               
زیرمجموعه‌های یک تابع محدب،برای هر مقدار از $a$ محدب هستند.این اثبات از تعریف تحدب ضروری است: اگر $x,y\in C_\alpha$،پس $f(x)\leq \alpha$ و $f(y)\leq\alpha$،و بنابراین $f(\theta x+(1-\theta)y)\leq\alpha$ برای $0\leq\theta\leq 1$،و از‌این‌رو $\theta x+(1-\theta)y\in C_\alpha$ .
معکوس این قضیه درست نیست:یک تابع می‌تواند همه‌ی زیرمجموعه‌های محدب آن را داشته باشند،اما یک تابع محدب نباشد.مثلا،$f(x)=-e^x$ در $R$محدب نیست(درواقع،شدیداٌ مقعر است) اما تمام زیرمجموعه‌های آن  محدب هستند.اگر $f$ مقعر باشد،پس تمام $\alpha$-فوق‌سطح آن  داده می‌شود با$\lbrace x\in \textbf{dom} f|f(x)\geq\alpha\rbrace$،یک مجموعه محدب است.این ویژگی زیرمجموعه،با بیان آن به عنوان یک زیرمجموعه از تابعی محدب،یا به عنوان مجموعه مرجع از تابعی مقعر اغلب روش خوبی  برای  تحدب یک مجموعه است.

\begin{example}
میانگین هندسی و ریاضی $x\in R_+^n$ بترتیب هستند;

\[
G(x)=\left(
\prod_{i=1}^n x_i\\
\right)^{1/n} ,\qquad  A(x)=\frac{1}{n}\sum_{i=1}^n x_i ,
\]

(که $0^{1/n}=0$ را در تعریفمان از $G$ میگیریم.)میانگین ریاضی - هندسی نابرابری بیان می‌کند که $G(x)\leq A(x)$ . فرض کنید $0\leq\alpha\leq 1$ و درنظر بگیرید مجموعه 

\[
\lbrace x\in R_+^n|G(x)\geq\alpha A(x)\rbrace,
\]

یعنی مجموعه بردارها با میانگین هندسی حداقل به بزرگی عامل $a$ با میانگین ریاضی متقارن است.این مجموعه محدب است،چون( مجموعه فوق سطح – 0 ) از تابع $G(x)-\alpha A(x)$ است،که مقعر است.درواقع،این مجموعه به طور مثبت همگن است،بنابراین آن مخروط محدب است.
\end{example}

\subsection{بالای نمودار}
نمودار تابع $f:R^n\rightarrow R$ تعریف می‌شود بعنوان 

\[
\lbrace(x,f(x))|x\in \textbf{dom} f\rbrace,
\]
که زیر‌مجموعه‌ای از $R^{n+1}$، است.بالای نمودار یک تابع $f:R^n\rightarrow R$ تعریف می‌شود به عنوان 

\[
\textbf{epi} f=\lbrace(x,t)|x\in\textbf{dom} f,\;f(x)\leq t\rbrace,
\]
که زیر‌مجموعه‌ای از $R^{n+1}$ است.( $epi$ به معنای بالاست پس $epigraph$ به معنای بالای نمودار است.)این تعریف در شکل 3.5 نشان داده می‌شود.رابطه بین مجموعه‌های محدب و توابع محدب از طریق $epigraph$ (بالای نمودار) است: $A$یک تابع محدب است اگر‌و‌تنها‌اگر بالای نمودار آن یک مجموعه محدب است.یک تابع مقعر است اگر‌و‌تنها‌اگر $hypograph$ آن تعریف شد به عنوان 

\[
\textbf{hypo} f=\lbrace(x,t)|t\leq f(x)\rbrace,
\]
مجموعه‌ای محدب است.

شکل ۳.۵

\begin{example}


 تابع کسری ماتریس.تابع $f:R^n\times S^n\rightarrow R$،تعریف می‌شود به عنوان

\[
f(x,Y)=x^T Y^{-1}x
\]

در $dom f=R^n\times S_{++}^n$ محدب است.(این مثال تابع درجه دوم را بر تابع خطی$f(x,y)=x^2/y$، با $dom f=R\times R_{++}$ کلیت می‌بخشد.)یک روش آسان برای ایجاد تحدب $f$ از طریق $epigraph$ آن صورت می‌گیرد:

\begin{align*}
\textbf{epi} f &=\lbrace(x,Y,t)|Y\succ 0,\;x^TY^{-1}x\leq t\rbrace\\
& =\begin{Bmatrix}
(x,Y,t)\vert \begin{bmatrix}
Y & x\\
x^T & t\\
\end{bmatrix}
\succeq 0,\:Y\succ 0,
\end{Bmatrix}
\end{align*}


                           با استفاده از حالت مکمل اسچور برای نیمه معین مثبت ماتریس بلوکی (5 .5.A §را ببینید).آخرین حالت نابرابری ماتریس خطی در $(x,Y,t)$ است،و بنابراین $\textbf{epi} f$ محدب است.برای این حالت خاص $n=1$،تابع کسری ماتریس به تابع درجه دوم بر تابع خطی $x^2/y$ ساده می‌شود،و ارائه $LMI$ وابسته است

\[
\begin{bmatrix}
y & x\\
x & t\\
\end{bmatrix}
\succeq 0 ,\quad y>0
\]
 (نمودار آن در شکل 3.3 نشان داده می‌شود.)
 \end{example}
 نتایج بسیاری برای توابع محدب می‌تواند به طور هندسی با استفاده از اپی‌گراف‌‌ها،و با به کار بردن نتایج برای مجموعه‌های محدب  ثابت شود(یا تفسیر شود).به عنوان یک مثال،حالت مرتبه اول برای تحدب  را در نظر بگیرید:
 
\[
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x),
\]
که $f$ محدب است و $x,y\in dom f$ . می‌توانیم این نابرابری اساسی را به طور هندسی در عبارت $\textbf{epi} f $ تفسیر کنیم.اگر $(y,t)\in \textbf{epi} f$،پس

\[
t\geq f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x).
\]                               
 
شکل ۳.۶
می‌توانیم این‌ را بیان کنیم مانند:
\[
 (y,t)\in\textbf{epi} f\Longrightarrow \Longrightarrow\begin{bmatrix}
 \bigtriangledown f(x)\\
 -1\\
 \end{bmatrix}
 ^T\left(
 \begin{bmatrix}
 y\\
 t\\
 \end{bmatrix}
 -\begin{bmatrix}
 x\\
 f(x)\\
 \end{bmatrix}
 \right)
 \leq 0.
 \]
این به این معناست که$hyperplane$ تعریف شده با $(\bigtriangledown f(x),-1)$ پشتیبانی می‌کند$\textbf{epi} f$ را در نقطه مرزی $(x,f(x))$;شکل 3.6 را ببینید.
\subsection{نابرابری و پسوندهای جنسن}
نابرابری اساسی (3.1)،یعنی
\[
f(\theta x+(1-\theta)y)\leq\theta f(x)+(1-\theta)f(y),
\]
                    
گاهی نابرابری جنسن نامیده می‌شود.آن به آسانی به ترکیبات محدب بیشتر از دو نقطه گسترش داده می‌شود:اگر $f$ محدب باشد،$x_1,\ldots,x_k\in\textbf{dom} f$،و $\theta_1,\ldots,\theta_k\geq 0$ با $\theta_1+\cdots+\theta_k=1$،پس 
\[
f(\theta_1 x_1+\cdots+\theta_k x_k)\leq \theta_1 f(x_1)+\cdots+\theta_k f(x_k).
\]

در نتیجه،در مورد مجموعه‌های محدب،این نابرابری به حاصل جمع نامتناهی،انتگرال،و مقادیر مورد انتظار گسترش داده می‌شود.مثلا،اگر $p(x)\geq 0$ در $S\subseteq\textbf{dom} f$،$\int_S p(x)\dd x$ پس

\[
f\left(\int_S p(x)x\dd x\right)\leq\int_S f(x)p(x)\dd x,
\]
مشروط به انتگرالهایی که وجود دارد.در حالت کلی می‌توانیم هر احتمال اندازه‌گیری را با حمایت در $\textbf{dom}$   در نظر 
 بگیریم.اگر $x$ متغیری تصادفی باشد به طوریکه $x\in  \textbf{dom} f$با احتمال یک،و $f$ محدب است،پس داریم 

\begin{equation}
f(Ex)\leq E f(x),
\end{equation}

مشروط به انتظاراتی که وجود دارد.می‌توانیم نابرابری اساسی (3.1) را ازاین شکل کلی،با در نظر گرفتن متغیر تصادفی $x$ که از $\lbrace x_1,x_2\rbrace$ حمایت می‌کند،با $\textbf{prob}(x=x_1)=\theta$،$\textbf{prob}(x=x_2)=1-\theta$ بازیابی کنیم.بنابراین نابرابری (3.5) تحدب را مشخص می‌کند:اگر $f$ محدب نباشد,متغیر تصادفی $x$،با $x\in\textbf{dom} f$ با احتمال یک،به طوریکه $f(Ex)=Ef(x)$ وجود دارد.حالا تمام این نابرابریها،نابرابری جنسن نامیده می‌شود،حتی اگر نابرابری مورد مطالعه توسط جنسن یک  
\[
f\left(\frac{x+y}{2}\right)\leq\frac{f(x)+f(y)}{2}
\]
بسیار ساده بود.

\begin{remark}

می‌توانیم (3.5) را به شرح زیر تفسیر کنیم.فرض کنید $x\in\textbf{dom} f\subseteq R^n$ و $z$ هرمقدار بردار تصادفی صفر در $R^n$ است . پس داریم 
\[
Ef(x+z)\geq f(x).
\]
بنابراین،تصادفی یا لرزشی (یعنی با اضافه کردن مقدار بردار تصادفی صفر برای استدلال )نمی‌تواند مقدار تابع محدب را به طور متوسط کاهش دهد. 
\end{remark}

\subsection{نابرابری}

بسیاری از نابرابریهای معروف می‌تواند با استفاده از نابرابری جنسین به تعدادی تابع محدب مناسب مشتق شود.(درواقع،تحدب و نابرابری  جنسین می‌تواند پایه و اساس یک نظریه نابرابری را بسازد.)به عنوان یک مثال ساده,میانگین نابرابری ریاضی – هندسی را در نظر بگیرید:

\begin{equation}
\sqrt{ab}\leq(a+b)/2
\end{equation}

 برای $a,b\geq 0$. تابع $-log \;x$ محدب است.نابرابری جنسن با .$\theta=1/2$ حاصل 
 
\[
-log\left(\frac{a+b}{2}\right)\leq\frac{-log\;a-log\;b}{2}
\]

با در نظر گرفتن نمایی از دو سمت (3.6) حاصل می‌شود. به عنوان یک مثال کم اهمیت‌تر نامساوی هولدر را ثابت می‌کنیم:برای $p> 1$،$1/p+1/q=1$ و $x,y\in R^n$،

\[
\sum_{i=1}^n x_i y_i\leq\left(\sum_{i=1}^n |x_i|^p\right)^{1/p}\left(\sum_{i=1}^n |y_i|^q\right)^{1/q}.
\]

با تحدب$-log\;x$، و نابرابری جنسن به طور کلی $\theta$،میانگین نابرابری ریاضی هندسی کلی‌تری را به دست می‌آوریم.

\[
a^\theta b^{1-\theta}\leq \theta a+(1-\theta)b,
\]

برای $a,b\geq 0$ و $0\leq\theta\leq 1$ معتبر است.به کار بردن این را با 

\[
a=\frac{|x_i|^p}{\sum_{j=1}^n |x_j|^p},\qquad b=\frac{|y_i|^q}{\sum_{j=1}^n |y_j|^q},\qquad \theta=1/p,
\]
حاصل می‌شود
\[
\left(\frac{|x_i|^p}{\sum_{j=1}^n |x_j|^p}\right)^{1/p}\left(\frac{|y_i|^q}{\sum_{j=1}^n |y_j|^q}\right)^{1/q}\leq\frac{|x_i|^p}{p\sum{j=1}^n |x_j|^p}+\frac{|y_i|^q}{q\sum_{j=1}^n |y_j|^q}.
\]
  
با جمع کردن $i$ پس نابرابری هولدر حاصل می‌شود.

\section{عملکردهایی که تحدب را حفظ می‌کند}

در این بخش برخی عملکردهایی را که تحدب و تقعر توابع را حفظ می‌کند،یا به ما اجازه می‌دهد که توابع محدب و مقعر جدید بسازیم را شرح می‌دهیم.با برخی عملکردهای ساده مثل افزایش،مقیاس‌گذاری،و سوپریمم نقطه نقطه شروع می‌کنیم و سپس برخی عملکردهای پیچیده‌تر مثل (برخی از آنها عبارتند از عملکردهای ساده مانند موارد خاص)  را شرح می‌دهیم.

\subsection{مقادیر وزن‌دار غیرمنفی}

بدیهی ست اگر $f$ تابعی محدب و$\alpha\geq 0$،است،پس تابع $\alpha f$ محدب است.اگر $f_1$ و $f_2$ هر دو توابع محدب هستند،پس مجموع آنها $f_1+f_2$ است.با ترکیب مقیاس‌گذاری و افزایش غیرمنفی ،می‌بینیم که مجموعه‌ای از توابع محدب خودش مخروطی محدب است:مقادیر وزن‌دار غیر منفی توابع محدب،
\[
f=\omega_1 f_1+\cdots+\omega_m f_m,
\]

محدب است.به همین شکل،مقادیر وزن‌دار غیر‌منفی توابع مقعر،مقعر است.مقادیر وزن‌دار غیر‌منفی،غیر‌صفر توابع شدیدا محدب (مقعر) شدیدا محدب (مقعر ) است.این ویژگی‌ها به مقادیر نامتناهی و انتگرال‌ها گسترش می‌یابد.مثلا،اگر $f(x,y)$در $x$ برای هر $y\in\mathcal{A}$،و $\omega(y)\geq 0$ برای هر $y\in\mathcal{A}$ محدب است،پس تابع $g$ تعریف می‌شود به عنوان

\[
g(x)=\int_\mathcal{A}\omega(y) f(x,y)\dd y
\]

 در $x$ محدب است(مشروط به اینکه انتگرال وجود دارد.).واقعیت این است که تحدب تحت مقیاس‌گذاری و افزایش غیر‌منفی به آسانی مستقیما بازبینی می‌شود،یا می‌تواند درشرایط اپی‌گراف‌های وابسته دیده شود.مثلا،اگر $\omega\geq 0$ و$f$ محدب باشد،داریم 
 
 \[
 \textbf{epi}(\omega f)=\begin{bmatrix}
 I & 0\\
 0 & \omega\\
 \end{bmatrix}
 \textbf{epi}f,
 \]

که محدب است چون تصویر مجموعه‌ای محدب تحت نگاشتی خطی محدب است.
\subsection{ترکیب با نگاشتی معین}

فرض کنید $f:\mathbf{R}^n\rightarrow\mathbf{R}$،$A\in\mathbf{R}^{n\times m}$،و $b\in\mathbf{R}^n$ . تعریف کنید $g:\mathbf{R}^m\rightarrow\mathbf{R}$ را با 
\[
g(x)=f(Ax+b),
\]
با$g=\lbrace x\mid Ax+b\in \textbf{dom} f\rbrace$  .پس اگر $f$ محدب باشد پس $g$ است،اگر $f$ مقعر باشد،پس $g$ است.
\subsection{ماکزیمم و سوپریمم نقطه به نقطه}

اگر $f_1$  و$f_2$ توابع محدب هستند پس ماکزیمم نقطه به نقطه $f$ تعریف می‌شود با 

\[
f(x)=max\lbrace f_1(x),f_2(x)\rbrace ,
\]

با$\textbf{dom} f=\textbf{dom}f_1\cap\textbf{dom} f_2$،نیز محدب است.این ویژگی به آسانی بازبینی می‌شود: اگر $0\leq\theta\leq 1$ و$x,y\in\textbf{dom} f$،پس

\begin{align*}
f(\theta x+(1-\theta)y) & = max\lbrace f_1(\theta x+(1-\theta)y),f_2(\theta x+(1-\theta)y\rbrace\\
& \leq max\lbrace\theta f_1(x)+(1-\theta)f_1(y),\theta f_2(x)+(1-\theta)f_2(y)\rbrace\\
& \leq\theta max\lbrace f_1(x),f_2(x)\rbrace +(1-\theta)max\lbrace f_1(y),f_2(y)\rbrace\\
& =\theta f(x)+(1-\theta)f(y),
\end{align*}

که تحدب $f$ را ایجاد می‌کند.به آسانی نشان داده می‌شود که اگر $f_1,\ldots,f_m$ محدب هستند.پس ماکزیمم نقطه به نقطه 

\[
f(x)=max\lbrace f_1(x),\ldots,f_m(x)\rbrace
\]
نیز محدب است.

\begin{example}
توابع تکه‌ای-خطی.تابع 

\[
f(x)=max\lbrace a_1^T x+b_1,\ldots,a_l^T x+b_l\rbrace
\]
                             
تابع تکه‌ای-خطی (یا واقعا،معین)(با $L$ یا ناحیه کمتر)را تعریف می‌کند.آن محدب است چون ماکزیمم نقطه به نقطه توابع معین است.معکوس این قضیه نیز می‌تواند نشان داده شود: هر تابع محدب تکه ای-خطی با $L$ یا ناحیه کمتر می‌تواند در این شکل بیان شود.

\end{example}

\begin{example}
مجموع بزرگترین قطعات $r$ .برای $x\in\mathbf{R}^n$  با $x_{[i]}$  بزرگترین جزئ $i$ام    $x$مشخص می‌کنیم، یعنی
\[
x_{[1]}\geq x_{[2]}\geq\cdots\geq x_{[n]}
\]

اجزای $x$ در ترتیب غیر‌افزایشی طبقه‌بندی می‌شوند.پس تابع
\[
f(x)=\sum_{i=1}^r x_{[i]},
\]
مجموع بزرگترین اجزای $r$ از $x$ تابعی محدب است.این می‌تواند با نوشتن آن به عنوان 
\[
f(x)=\sum_{i=1}^r x_{[i]}=max\lbrace x_{i_1}+\cdots+x_{i_r}\mid 1\leq i_1< i_2<\cdots<i_r\leq n\rbrace,
\]
دیده شود.یعنی،ماکزیمم تمام مقادیر ممکن اجزای متفاوت $r$ از $x$.از آنجائی‌ که ماکزیمم نقطه به نقطه توابع خطی $n!/(r!(n-r)!)$  است،آن محدب است.به عنوان یک پسوند آن می‌تواند نشان داده شود که تابع $\sum_{i=1}^r w_i x_{[i]}$ محدب است،مشروط بر اینکه $w_1\geq w_2\geq\cdots\geq w_r\geq 0$. 
ویژگی ماکزیمم نقطه به نقطه به سوپریمم نقطه به نقطه بیش از مجموعه نامتناهی توابع محدب گسترش می‌یابد.اگر برای هر $y\in\mathcal{A}$ ،$f(x,y)$ در $x$ محدب است،پس تابع $g$ تعریف شده به طوریکه

\begin{equation}
g(x)=\underset{y\in\mathcal{A}}{\sup} f(x,y)
\end{equation}

در $x$ محدب است.در اینجا دامنه $g$ است
\[
\emph{dom} g=\lbrace x|(x,y)\in\emph{dom}برای هر y\in\mathcal{A},\:\underset{y\in\mathcal{A}}{\sup} f(x,y)<\infty\rbrace.
\]

به همین ترتیب،اینفیمم نقطه به نقطه  مجموعه‌ای از توابع مقعر تابعی مقعر است.به لحاظ اپی‌گرافها، سوپریمم نقطه به نقطه توابع مربوط به تلاقی اپی‌گرافها است:با $f$،$g$ و $\mathcal{A}$ همان‌طور که در (3.7) تعریف شد،داریم

\[
\emph{epi} g=\underset{y\in\mathcal{A}}{\bigcap}\emph{epi} f(\cdot,y).
\]

بنابراین،نتیجه زیر از این حقیقت این است که تلاقی خانواده‌ای از مجموعه‌های محدب،محدب است.

\end{example}
\begin{example}
تابع تائید از یک مجموعه.فرض کنید $C\subseteq\mathbf{R}^n$،با $C\neq\emptyset$. تابع تائید $S_C$    مرتبط با مجموعه $C$ تعریف می‌شود به‌طوری‌که
\[
S_C(x)=\sup\lbrace x^T y|y\in C\rbrace
\] 

(و، طبیعتا $\emph{dom} S_C=\lbrace x|\sup_{y\in C} x^T y<\infty\rbrace$).
برای هر $y\in C$، $x^T y$  تابعی خطی از $x$ است، پس $S_C$ سوپریمم  نقطه به نقطه‌ی خانواده‌ای از توابع خطی است، بنابراین، محدب است.
\end{example}

\begin{example}
فاصله دورترین نقطه از یک مجموعه.فرض کنید$C\subseteq\mathbf{R}^n$. این فاصله(در هر قاعده) برای دورترین نقطه‌ی $C$،
\[
f(x)=\underset{y\in C}{\sup}\Vert x-y\Vert،
\]
محدب است.برای دیدن این، توجه کنید که برای هر $y$، تابع$\Vert x-y\Vert$ در $x$ محدب است. از آنجائی‌که $f$ سوپریمم نقطه به نقطه خانواده‌ای از توابع محدب است (نشان داده می‌شود با$y\in C$)، آن تابعی محدب از $x$ است.
\end{example}

\begin{example}
ارزش حداقل-مجذورها به عنوان تابعی از وزنها. فرض کنید$a_1,\ldots,a_n\in\mathbf{R}^m$ .در مسئله حداقل-مجذورهای وزن‌دار تابع هدف$\sum_{i=1}^n w_i(a_i^T x-b_i)^2$  را بیشتر از $x\in\mathbf{R}^m$  به حداقل می‌رسانیم.به $w_i$ به عنوان وزن‌دار اشاره می‌کنیم، و $w_i$ منفی را می‌پذیریم(که این احتمال را که تابع هدف زیر بیکران است را باز می‌کند). ارزش حداقل-مجذورات وزن‌دار (بهینه) را تعریف کردیم به‌طوری‌که 


\[
g(w)=\underset{x}{\inf}\sum_{i=1}^n w_i(a_i^T x-b_i)^2,
\]
با دامنه

\[
\emph{dom}\:g=\begin{Bmatrix}
w\arrowvert\underset{x}{\inf}\sum_{i=1}^n w_i(a_i^T x-b_i)^2>-\infty
\end{Bmatrix}
\]

ازآنجائی‌که $g$ خانواده‌ای از توابع خطی $w$ (نشان داده می‌شود با $x\in\mathbf{R}^n$)، آن تابع مقعر $w$ است.می‌توانیم بیانی صریح و روشن برای $g$ استنتاج کنیم، تقریبا بر روی بخشی از دامنه آن. فرض کنید ، ماتریس مورب با عناصر$w_1,\ldots,w_n$، و فرض کنید $A\in\mathbf{R}^{n\times m}$  ردیف‌های ${a_i}^T$ را دارد، بنابراین داریم 

\[
g(w)=\underset{x}{inf}(Ax-b)^T W(Ax-b)=\underset{x}{inf}(x^T A^T WAx-2b^T WAx+b^T Wb).
\]
از این توضیحات دیدیم که اگر $A^T WA\nsucceq 0$، تابع درجه دوم زیر در $x$ بیکران است، پس $g(w)=-\infty$،  یعنی $w\notin\emph{dom}\:g$ .می‌توانیم بیان ساده‌ای برای $g$ بدهیم زمانی‌که $A^T WA\succ 0$ (که نابرابری ماتریس خطی شدیدی را تعریف می‌کند),با به حداقل رساندن تابع درجه دوم  به‌طور تحلیلی:

\begin{align*}
g(w) & =b^T Wb-b^T WA(A^T WA)^{-1} A^T Wb\\
& =\sum_{i=1}^n w_i b_i^2-\sum_{i=1}^n w_i^2 b_i^2 a_i^T\left(\sum_{j=1}^n w_j a_j a_j^T\right)^{-1}a_i.
\end{align*}
از این بیان تقعر $g$  فورا آشکار نمی‌شود(اما آن را دنبال می‌کند، مثلا، از تحدب تابع کسری ماتریس; مثال 3.4 را ببینید).
 
\end{example}

\begin{example}
حداکثر مقادیر ویژه ماتریس متقارن.تابع $f(\mathbf{X})=\lambda_max(\mathbf{X})$، با $\emph{dom}\:f=\emph{S}^{rn}$، محدب است. برای دیدن این توضیح، $f$ را بیان می‌کنیم به‌طوری‌که 

\[
f(\mathbf{X})=\sup\lbrace y^T\mathbf{X} y|\:\Vert y\Vert_2=1\rbrace,
\]
یعنی بعنوان سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع خطی $\mathbf{X}$ (یعنی $y^T\mathbf{X}y$)نشان داده می‌شود با $y\in\mathbf{R}^m$.

\end{example}

\begin{example}

قاعده یک ماتریس. $f(\mathbf{ٓٓX})=\Vert\mathbf{X}\Vert_2$ را با $\mathbf{dom}\: f=\mathbf{R}^{p\times q}$، درنظر بگیرید، که $\Vert\cdot\Vert_2$ قاعده طیفی یا مقدار منحصر بفرد ماکسیمم را نشان می‌دهد. تحدب $f$ استنباط می‌شود از 
\[
f(\mathbf{X})=\sup\lbrace u^T\mathbf{X}\upsilon|\:\Vert u\Vert_2=1,\:\Vert\upsilon\Vert_2=1\rbrace,
\]
که نشان می‌دهد که آن سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع خطی $X$ است.به عنوان یک کلیت فرض کنید $\Vert\cdot\Vert_a$ و $\Vert\cdot\Vert_b$ به ترتیب قاعده‌هایی در $\mathbf{R}^p$ و $\mathbf{R}^q$ است. قاعده ناشی از ماتریس $\mathbf{X}\in\mathbf{R}^{p\times q}$ تعریف می‌شود به عنوان 

\[
\Vert\mathbf{X}\Vert_{a,b}=\underset{\upsilon\neq 0}{\sup}\frac{\Vert\mathbf{X}_\upsilon\Vert_a}{\Vert\upsilon\Vert_b}.
\]
(این زمانی‌که هر دو قاعده اقلیدسی هستند به قاعده طیفی ساده می‌شود.)قاعده استنتاج شده می‌تواند بیان شود به عنوان 

\begin{align*}
\Vert\mathbf{X}\Vert_{a,b} &=\sup\lbrace\Vert\mathbf{X}_\upsilon\Vert_a\:|\:\Vert\upsilon\Vert_b=1\rbrace\\
&=\sup\lbrace u^T\mathbf{X}\upsilon\:|\:\Vert u\Vert_{a^*}=1,\:\Vert\upsilon\Vert_b=1\rbrace,
\end{align*}

که $\Vert\cdot\Vert_{a^*}$ قاعده $\Vert\cdot\Vert_a$، دوگانه  است و این حقیقت را به‌کار می‌بریم که 

\[
\Vert z\Vert_a=\sup\lbrace u^T z\:|\:\Vert u\Vert_{a^*}=1\rbrace.
\]
ازانجائی‌که $\Vert\mathbf{X}\Vert_{a,b}$ را به‌ عنوان سوپریمم توابع خطی $\mathbf{X}$ بیان کردیم، تابعی محدب است.
 
\end{example}

\section*{ارائه به عنوان سوپریمم نقطه به نقطه توابع معین}
مثال‌های بالا روش خوبی برای گسترش تحدب یک تابع را نشان می‌دهند: با بیان آن به عنوان سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع معین.جز برای شرایط فنی، معکوس را حفظ می‌کند: تقریبا هر تابع محدبی می‌تواند به عنوان سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع معین بیان شود.مثلا، اگر $f:\mathbf{R}^n\rightarrow\mathbf{R}$ محدب باشد، با $\mathbf{dom}\: f=\mathbf{R}^n$، پس داریم 

\[
f(x)=\sup\lbrace g(x)\:|\:g\:\text{معین},\:g(z)\leq f(z)\:\text{برای هر}\: z\rbrace.
\]
به عبارت دیگر$f$، سوپریمم نقطه به نقطه‌ی مجموعه‌ای از تمام برآوردگرهای معین معروف تحت آن است. اثبات این نتیجه را در زیر می‌دهیم، و این مورد را که $\mathbf{dom}\: f=\mathbf{R}^n$ به عنوان یک تمرین است را رها می‌کنیم(تمرین 3.28).فرض کنید $f$ با $\mathbf{dom}\: f=\mathbf{R}^n$ محدب است. نابرابری 

\[
f(x)\geq\sup\lbrace g(x)\:|\:g\:\text{معین},\:g(z)\leq f(z)\:\text{برای هر}\:z\rbrace
\] 

واضح است، چون اگر $g$، تحت هر برآوردگر معین $f$ باشد، داریم $g(x)\leq f(x)$. برای ایجاد برابری، نشان می‌دهیم که برای هر $x\in\mathbf{R}^n$ یک تابع معین $g$ وجود دارد، که تحت برآوردگر معروف $f$ است و $g(x)=f(x)$ را اثبات می‌کند. البته اپی‌گراف بالای نمودار $f$ مجموعه‌ای محدب است. بنابراین، می‌توانیم بیابیم یک ابرصفحه را برای آن در $(x,f(x))$ یعنی $a\in\mathbf{R}^n$ و $b\in\mathbf{R}$ با $(a,b)\neq 0$ و 

\[
\begin{bmatrix}
a\\
b\\
\end{bmatrix}^T
\begin{bmatrix}
x-z\\
f(x)-t\\
\end{bmatrix}\leq 0
\]

برای هر$(z,t)\in\mathbf{epi} f$.این به این معنی است که

\begin{equation}
a^T(x-z)+b(f(x)-f(z)-s)\leq 0
\end{equation}

برای تمام $z\in\mathbf{dom}\: f=\mathbf{R}^n$ و تمام $s\geq 0$ (چون $(z,t)\in\mathbf{epi} f$ یعنی $t=f(z)+s$ برای برخی از $s\geq 0$). برای نابرابری (3.8) که برای همه $s\geq 0$ حفظ می‌کند، باید داشته باشیم $b\geq 0$.اگر $b=0$، پس نابرابری (3.8) به $a^T(x-z)\leq 0$ برای تمام $z\in\mathbf{R}^n$ ساده می‌شود که $a=0$ و تضادهای $(a,b)\neq 0$ را دلالت می‌کند. نتیجه می‌گیریم که $b>0$ یعنی، اینکه ابرصفحه عمودی نیست.

با استفاده از این حقیقت که $b>0$ برای $s=0$ بازنویسی می‌کنیم به عنوان

\[
g(z)=f(x)+(a/b)^T(x-z)\leq f(z)
\]

برای هر $z$.تابع  $g$ تحت برآوردگر معین $f$ است و $g(x)=f(x)$ را اثبات می‌کند. 

\subsection{ترکیب}

در این بخش شرایط را در $h:\mathbf{R}^k\rightarrow\mathbf{R}$ و $g:\mathbf{R}^n\rightarrow\mathbf{R}^k$ بررسی می‌کنیم که تحدب یا تقعرترکیب آنها را در $f=hog:\mathbf{R}^n\rightarrow\mathbf{R}$ تضمین می‌کند، تعریف می‌شود با
 
\[
f(x)=h(g(x)),\qquad\mathbf{dom}\: f=\lbrace x\in\mathbf{dom}\: g\:|\:g(x)\in\mathbf{dom}\; h\rbrace.
\]
\section*{ترکیب عددی}

ابتدا نمونه $k=1$ را در نظر می‌گیریم، پس $h:\mathbf{R}\rightarrow\mathbf{R}$ و$g:\mathbf{R}^n\rightarrow\mathbf{R}$ .می‌توانیم خودمان را به مورد $n=1$ محدود کنیم (چون تحدب با رفتار یک تابع درخطوط دلخواه که دامنه خود را از وسط قطع می‌کند، مشخص می‌شود. برای یافتن قواعد ترکیب، با این فرض که $h$ و $g$ دوبار مشتق‌پذیرند، با $\mathbf{dom}\:g=\mathbf{dom}\:h=\mathbf{R}$ شروع می‌کنیم. در این مورد، تحدب $f$ به $f''\geq 0$ کاسته می‌شود.( به این معنی که $f''(x)\geq 0$ برای تمام $x\in\mathbf{R}$). مشتق دوم تابع ترکیب $f=hog$ داده می‌شود با 

\begin{equation}
f''(x)=h''(g(x))g'(x)^2+h'(g(x))g''(x).
\end{equation}

حالا فرض کنید که، مثلا، $g$ محدب باشد (پس $g''\geq 0$) و $h$ محدب و غیر‌کاهشی است (پس $h''\geq 0$ و $h'\geq 0$). آن از (3.9) پیروی می‌کند که $f''\geq 0$. یعنی،$f$ محدب است. در روشی مشابه، عبارت (3.9) این نتایج را می‌دهد: 

\begin{equation}
\begin{align*}
 
$f$ محدب است اگر $h$ محدب و غیر‌کاهشی است، و $g$ محدب است. 
$f$ محدب است اگر $h$  محدب و غیر‌افزایشی باشد، و $g$ مقعر است.                                                                                                                                                                                                  
$f$ مقعر است اگر $h$ مقعر و غیر‌کاهشی باشد، و $g$ مقعر است. 
$f$ مقعر است اگر $h$ مقعر و غیر‌افزایشی باشد، و $g$ محدب است. 
\end{align*}
\end{equation}
زمانیکه توابع $g$ و $h$ دو‌بار مشتق پذیر هستند و دامنه‌هایی دارند که همه از $\mathbf{R}$ هستند این توضیحات معتبرند. به نظر می‌رسد که قواعد ترکیب بسیار مشابه در حالت کلی $n>1$، بدون درنظرگرفتن قابلیت مشتق‌پذیری $h$ و $g$ یا اینکه $\mathbf{dom}\:g=\mathbf{R}^n$ و $\mathbf{dom}\:h=\mathbf{R}$ را حفظ می‌کند. 
\begin{equation}
 
$f$ محدب است اگر $h$ محدب باشد،$\tilde{h}$ غیر‌کاهشی است، و $g$ محدب است. 
$f$ محدب است اگر $h$ محدب باشد، $\tilde{h}$ غیر‌افزایشی است، و $g$ مقعر است. 
$f$ مقعر است اگر $h$ مقعر باشد، $\tilde{h}$ غیر‌کاهشی است، و $g$ مقعر است.    
$f$  مقعر است اگر $h$ مقعر باشد، $\tilde{h}$غیر‌افزایشی است، و $g$ محدب است. 
\end{equation}


\end{document}