\documentclass[12pt]{article}
\usepackage{amsmath}
\usepackage{xepersian}
\settextfont{XB Zar}
\settextfont{Yas}
\setdigitfont{Yas}
\linespread{1.25} 
\newtheorem{definition}{تعریف}[section]
\newtheorem{theorem}[section]{قضیه}
\newcommand{\dd}{\,\mathrm{d}}
\newcommand{\ee}{\,\mathrm{d}}
\newtheorem{example}{مثال }[section]
\newtheorem{remark}{تذکر}[section]
\settextfont[Scale=1.1]{Yas}
\begin{document}      
\textbf{\huge  توابع محدب}
 \section{ویژگیها و نمونه‌های پایه}
 \subsection{تعریف}


تابع$f:R^n\rightarrow R$محدب است اگر$domf$یک مجموعه محدب و اگر برای همه$x,y\in\mathbf{dom}\: f $ باشد،و$\theta$  با$0\leq\theta\leq1$  داریم

\begin{equation}
f(\theta x+(1-\theta)y\leq\theta f(x)+(1-\theta)f(y).
\end{equation}


به لحاظ هندسی،این نابرابری به این معنی است که پاره‌خط بین$(x,f(x))$و$(y,f(y))$ که این وتر از$x$  به$y$  است در بالای این نمودار از $f$ قرار می‌گیرد(شکل(۱.۳)). تابعی از $f$ که صرفاٌ محدب است اگر دارای نابرابری محض در(۱.۳) باشد هر‌وقت که $x\neq y$ و$0<\theta<1$.گفتیم $f$ مقعر است اگر $f$محدب باشد و اگر$f$ شدیدا محدب باشد $f$ شدیدا مقعر است. برای یک تابع معین همیشه در (3.1) برابری داریم، بنابراین تمام توابع معین ( و در نتیجه توابع خطی نیز) هم مقعر و هم محدب هستند. بالعکس هر تابع که محدب و مقعرباشد معین است.یک تابع محدب است اگر‌وتنها‌اگر زمانی‌که به هر خط که دامنه‌ی آن را قطع می‌کند محدود شد آن محدب است. یعنی $f$ محدب است اگر‌و‌تنها‌اگر برای همه $x\in dom f$ و 
شکل 3.1.نمودار یک تابع محدب. وتر (یعنی پاره خط) بین هر دو نقطه بر روی نمودار در بالای این نمودار قرار دارد.
تمام $\upsilon$ تابع $g(t)=f(x+t\upsilon)$ محدب است (بر روی دامنه‌ی آن $\lbrace t|x+t\upsilon\in\mathbf{dom}\:f\rbrace$).این ویژگی خیلی مفید است، چون به ما اجازه می‌دهد که بررسی کنیم آیا‌ تابعی به‌وسیله‌ی محدود کردن آن به یک خط، محدب است. تجزیه و تحلیل توابع محدب رشته توسعه یافته خوبی است،که در هر عمقی پیگیری نمی‌کنیم.یک نتیجه ساده، به‌عنوان مثال، این است که یک تابع محدب در فضای داخلی نسبی از دامنه‌ی آن پیوسته است; می‌تواند ناپیوستگی تنها در مرز نسبی آن داشته باشد.


\subsection{پسوندهای مقدار توسعه یافته}


اغلب برای گسترش یک تابع محدب برای تمام $R^n$ با تعریف مقدار آن که $\infty$ خارج از دامنه آن باشد، مناسب است. اگر $f$ محدب باشد پسوند مقدار توسعه یافته آن را $\tilde{f}$تعریف می‌کنیم    $\tilde{f}:\mathbf{R}^n\rightarrow\mathbf{R}\cup\lbrace\infty\rbrace$ با
\[
\tilde{f}=
\begin{cases}
f(x) & x\in\mathbf{dom}\:f\\
\infty & x\notin\mathbf{dom}\:f.
\end{cases}
\]
پسوند $\tilde{f}$ برای تمام $\mathbf{R}^n$، تعریف می‌شود و مقادیری در $\mathbf{R}\cup\lbrace\infty\rbrace$ می‌گیرد. می‌توانیم دامنه تابع  اصلی $f$ از پسوند $\tilde{f}$ دوباره به‌دست آوریم به‌طوری‌که$\mathbf{dom}\:f=\lbrace x|\tilde{f}(x)<\infty\rbrace$ .این پسوند می‌تواند علامت‌گذاری را ساده کند، چون آشکارا  نباید این دامنه را توصیف کنیم، یا مقدماتی برای تمام $x\in\mathbf{dom}\:f$ هر‌وقت که به$f(x)$ ،مراجعه می‌کنیم اضافه کنیم. برای مثال‌ نابرابری تعریف پایه (3.1) را در نظر بگیرید، به لحاظ پسوند $\tilde{f}$ می‌توانیم آن را بیان کنیم مانند: برای $0<\theta<1$.
\[
\tilde{f}(\theta x+(1-\theta)y)\leq\theta\tilde{f}(x)+(1-\theta)\tilde{f}(y)
\]
برای هر$x$ و$y$ .( برای $\theta=0$ یا $\theta=1$ همیشه دارای این نابرابری است.)البته در این کتاب باید این نابرابری را با استفاده از محاسبات گسترده و مرتب‌سازی بیان کنیم. برای $x$  و $y$  هر دو در $\mathbf{dom}\:f$ این نابرابری مقارن است با(3.1) .درصورتی که هر دو خارج  $\mathbf{dom}\:f$ باشد، پس سمت راست $\infty$ است، بنابراین این نابرابری را دارا است. به‌عنوان مثال دیگر از این شیوه علامت‌گذاری فرض کنید $f_1$ و $f_2$دو تابع محدب این روی $\mathbf{R}^n$ است. مجموع نقطه به نقطه $f=f_1+f_2$ تابع با دامنه $\mathbf{dom}\:f=\mathbf{dom}\:f_1\cap\mathbf{dom}\:f_2$، با $f(x)=f_1(x)+f_2(x)$ برای هر $x\in\mathbf{dom}\:f$است. با استفاده از پسوندهای مقدار گسترده به‌سادگی می‌توانیم بگوییم برای هر $\tilde{f}(x)=\tilde{f_1}(x)+\tilde{f_2}(x)$. در این معادله دامنه $f$ به‌طور خودکار به‌عنوان $\mathbf{dom}\:f=\mathbf{dom}\:f_1\cap\mathbf{dom}\:f_2$تعریف شده است،چون $\tilde{f}(x)=\infty$ هروقت $x\notin\mathbf{dom}\:f_1$ یا $x\notin\mathbf{dom}\:f_2$ .در این کتاب همان علامت را برای نشان دادن یک تابع محدب و پسوند آن به‌کار می‌بریم، هر‌وقت هیچ زیانی از این ابهام وجود نداشته باشد. این همان است که همان‌طور که فرض شد که تمام توابع محدب به‌طور ضمنی گسترش داده در این مثال بر محاسبات گسترده که به‌طور خودکار این دامنه را تعریف می‌کند تکیه می‌کنیم. در می‌شوند یعنی به‌عنوان $\infty$ خارج از دامنه‌شان تعریف می‌شوند.
\begin{example}
شاخص تابع یک مجموعه محدب.فرض کنید $C\subseteq\mathbf{R}^n$،یک مجموعه محدب باشد و تابع (محدب) $I_c$ را با دامنه $c$ و $I_c(x)=0$ برای تمام $x\in C$ درنظر بگیرید، یعنی این تابع در مجموعه $C$ عینا صفر است. پسوند مقدار گسترده آن. 
\end{example}
شکل3.2.اگر $f$ محدب و مشتق‌پذیر باشد‌، پس $f(x)+\bigtriangledown f(x)^T(y-x)\leq f(y)$برای تمام $x,y\in\mathbf{dom}\:f$.
داده می‌شود با:
\[
\tilde{I_c}(x)=
\begin{cases}
0 ,& x\in C\\
\infty ,& x\notin C.
\end{cases}
\]
تابع محدب $\tilde{I_c}$ شاخص تابع مجموعه $C$ نامیده می‌شود. می‌توانیم چند ترفند را با شاخص تابع $\tilde{I_c}$ بهکار ببریم. مثلا مسئله‌ی به حداقل رساندن یک تابع $f$ (تعریف شده برای تمام $\mathbf{R}^n$، می‌گویند) بر مجموعه $C$ همان به حداقل رساندن تابع $f+\tilde{I_c}$ بر تمام $\mathbf{R}^n$است. درواقع، تابع $f+\tilde{I_c}$ (با قراردادمان) $f$ محدود شده به مجموعه $C$ است. در روشی مشابه می‌توانیم تابعی مقعر را با تعریف آن گسترش دهیم تا $-\infty$ خارج از دامنه آن باشد.

\subsection{شرایط مرتبه اول}

فرض کنید $f$ مشتق‌پذیر  باشد ( یعنی شیب آن $\bigtriangledown f$ در هر نقطه در $\mathbf{dom}\:f$ وجود دارد که باز است). پس $f$ محدب است اگر‌وتنها‌اگر $\mathbf{dom}\:f$ محدب باشد و 

\begin{equation}
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x)
\end{equation}

برای تمام $x,y\in\mathbf{dom}\:f$ حفظ می‌کند. این نابرابری در شکل 3.2 نشان داده می‌شود. تابع معین $y$ با  $f(x)+\bigtriangledown f(x)^T(y-x)$داده شده، البته تقریب تیلور مرتبه اول $f$ نزدیک $x$ است. نابرابری (3.2)بیان می‌کند که برای یک تابع محدب، تقریب تیلور مرتبه اول در واقع تحت برآوردگر معروف تابع است. برعکس، اگر تقریب تیلور مرتبه اول یک تابع همیشه تحت برآوردگر معروف تابع باشد، پس تابع محدب است. نابرابری (3.2) اطلاعات محلی درباره یک تابع محدب را نشان می‌دهد (یعنی مقدار و مشتق آن در یک نقطه) می‌توانیم اطلاعات معروف را استنتاج کنیم (یعنی تحت برآوردگر معروف آن). شاید این مهمترین ویژگی توابع محدب باشد، و برخی ویژگیهای قابل توجه توابع محدب و مسائل بهینه‌سازی محدب را توضیح می‌دهد. به‌عنوان یک مثال ساده، نابرابری(3.2) نشان می‌دهد اگر $\bigtriangledown f(x)=0$پس برای تمام $y\in\mathbf{dom}\:f$ ،$f(y)\geq f(x)$یعنی $x$ یک کوچک شمار معروف تابع $f$ است. محدب شدیدا نیز می‌تواند با یک شرط مرتبه اول مشخص شود:$f$ اکیدا محدب است اگر‌و‌تنها‌اگر $\mathbf{dom}\:f$ محدب است و برای $x,y\in\mathbf[dom}\:f$ و$x\neq y$ ،داریم 

\begin{equation}
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x)
\end{equation}


برای توابع مقعر خصوصیات متناظر داریم:$f$ مقعر است اگر‌وتنها‌اگر $\mathbf{dom}\:f$ محدب باشد و 


\[
f(y)\leq f(x)+\bigtriangledown f(x)^T(y-x)
\]

                                 
برای تمام $x,y\in\mathbf{dom}\:f$.
\chapter*{اثبات شرط محدب درجه اول}
برای ثابت کردن (3.2)، اول حالت $n=1$ را درنظر می‌گیریم: تابع مشتق‌پذیر $f:\mathbf{R}\rightarrow\mathbf{R}$محدب است اگر‌و‌تنها‌اگر 

\begin{equation}
f(y)\geq f(x)+f‌‌‌‌‌'(x)(y-x)
\end{equation}

برای تمام $x$ و $y$ در $\mathbf{dom}\:f$ .اول فرض کنید که $f$ محدب است و $x,y\in\mathbf{dom}\:f$ نتیجه می‌گیریم که برای تمام $0<t\leq 1$ ، $x+t(y-x)\in\mathbf{dom}\:f$ و به‌وسیله‌ی تحدب $f$،

\[
f(x+t(y-x))\leq (1-t)f(x)+tf(y).
\]

اگر هر دو سمت را به $t$ تقسیم کنیم، به‌دست می‌آوریم

\[
f(y)\geq f(x)+\frac{f(x+t(y-x))-f(x)}{t},
\]

و با گرفتن حد به عنوان بازده $t\rightarrow o$.

برای نشان دادن قابلیت، فرض کنید این تابع (3.4) را برای تمام  $x$ و $y$ در $\mathbf{dom}\:f$ برآورده کند (که یک فاصله است). هر$x\neq y$،و $0\leq \theta\leq 1$،را انتخاب کنید و فرض کنید $z=\theta x+(1-\theta)y$. با دو برابر بازدهی 

\[
f(x)\geq f(z)+f'(z)(x-z),\qquad f(y)\geq f(z)+f'(z)(y-z).
\]

با ضرب کردن اولین نابرابری با $\theta$، و دومین نابرابری با $1-\theta$،و با اضافه کردن آنها به بازده

\[
\theta f(x)+(1-\theta)f(y)\geq f(z),
\]

که ثابت می‌کند $f$ محدب است. حالا می‌توانیم از دیدگاه کلی ثابت کنیم، با $f:\mathbf{R}^n\rightarrow\mathbf{R}$.فرض کنید $x,y\in\mathbf{R}^n$ و در نظر بگیرید $f$ به خطی که از میان آنها می‌گذرد محدود شده یعنی این تابع تعریف شده با 

\[
g(t)=f(ty+(1-t)x), so\quad g'(t)=\bigtriangledown f(ty+(1-t)x)^T(y-x).
\]

اول فرض کنید $f$ محدب است،که اشاره دارد $g$
 محدب است،پس با استدلال بالا داریم $g(1)\geq g(0)+g'(0)$ به این معنی که                         

\[
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x).
\]

حالا فرض کنید که این نابرابری را برای هر $x$ و $y$ حفظ می‌کند، پس اگر $ty+(1-t)x\in\mathbf{dom}\:f$   و $\tilde{t}y+(1-\tilde{t})x\in\mathbf{dom}\:f$،داریم 

\[
f(ty+(1-t)x\geq f(\tilde{t}y+(1-\tilde{t})x)+\bigtriangledown f(\tilde{t}y+(1-\tilde{t})x)^T(y-x)(t-\tilde{t}),
\]

یعنی $g(t)\geq g(\tilde{t})+g'(\tilde{t})(t-\tilde{t})$. دیدیم که این نشان می‌دهد که $g$ محدب است.
\subsection{شرایط مرتبه دوم}

حالا فرض می‌کنیم که $f$ دو بار مشتق‌پذیر است‌، یعنی هسیین آن یا مشتق دوم $\bigtriangledown^2f$ در هر نقطه در $\mathbf{dom}\:f$ وجود دارد، که باز است. پس $f$ محدب است اگر‌و‌تنها‌اگر $\mathbf{dom}\:f$ محدب باشد و هسیین آن نیمه‌ معین ‌مثبت است: برای تمام $x\in\mathbf{dom}\:f$،

\[
\bigtriangledown^2f(x)\succeq 0.
\]
برای تابعی بر روی$\mathbf{R}$ ،این به شرط ساده $f''(x)\geq 0$ساده می‌شود (و $\mathbf{dom}\:f$محدب، یعنی  یک فاصله)، که به این معنی است که مشتق غیر‌کاهشی است. این شرط $\bigtriangledown^2f(x)\succeq 0$ می‌تواند به لحاظ هندسی به‌عنوان نیاز تفسیر شود که نمودار تابع انحنای مثبت (رو به بالا)در $x$ دارد. اثبات شرط مرتبه دوم را به‌عنوان یک تمرین رها می‌کنیم (تمرین 3.8).به همین ترتیب،$f$ مقعر است اگر‌وتنها‌اگر $\mathbf{dom}\:f$محدب باشد و $\bigtriangledown^2f(x)\preceq 0$ برای تمام $x\in dom f$ .تحدب شدید می‌تواند تاحدی با شرایط مرتبه دوم مشخص شود.اگر $\bigtriangledown^2f(x)\succ 0$ برای تمام$x\in\mathbf{dom}\:f$ ، پس $f$ اکیدا محدب است. با این حال معکوس این درست نیست: مثلا، تابع $f:\mathbf{R}\rightarrow\mathbf{R}$داده می‌شود با $f(x)=x^4$ اکیدا محدب است اما در $x=0$ مشتق دوم صفر دارد.
\begin{example}

توابع درجه دوم.تابع درجه دوم $f:\mathbf{R}^n\rightarrow\mathbf{R}$ را با $f=\mathbf{R}^n$ در نظر بگیرید، داده می‌شود با 

\[
f(x)=(1/2)x^TPx+q^Tx+r,
\]

با$P\in S^n$، $q\in\mathbf{R}^n$ و $r\in R$. از آنجائی‌که $\bigtriangledown^2f(x)=P$برای تمام$x$ ،$f$ محدب است اگرو‌تنها‌اگر $P\succeq 0$(و مقعر است اگر‌و‌تنها‌اگر $P\preceq 0$).برای توابع درجه دوم، تحدب شدید به‌سادگی مشخص می‌شود:$f$ اکیدا محدب است اگر‌و‌تنها‌اگر $P\succ 0$(و اکیدا مقعر است اگر‌و‌تنها‌اگر $P\prec 0$).
\end{example}
\begin{remark}
شرط جداگانه که $\mathbf{dom}\:f$ محدب باشد نمی‌تواند از مشخصه‌های مرتبه اول و دوم تحدب و تقعر کاهش یابد. مثلا، تابع .$f(x)=1/x^2$ با $\mathbf{dom}\:f=\lbrace x\in\mathbf{R}\:|\:x\neq 0\rbrace $،$f''(x)>0$ را برای تمام $x  
\in\mathbf{dom}\:f$،براورده می‌کند، اما یک تابع محدب نیست.
\end{remark}
\subsection{مثالها}

قبلا گفتیم که همه توابع خطی و پیوسته محدب هستند(و مقعر)، و محدب و مقعر توابع درجه دوم را شرح دادیم. در این بخش به چند نمونه از توابع محدب و مقعر می‌پردازیم. با برخی توابع در$\mathbf{R}$ ،با متغیر $x$ شروع می‌کنیم.


\begin{itemize}
\item\textbf{نمایی:} $ee^{ax}$ در $\mathbf{R}$، برای هر $a\in\mathbf{R}$ محدب است.
\item\textbf{توانها:} $x^a$ در $\mathbf{R}_{++}$ محدب است زمانی‌که $a\geq 1$ یا $a\leq 0$، و مقعر است برای $0\leq a\leq 1$.
\item\textbf{توانهای قدر مطلق:}  $|x|^p$، برای $p\geq 1$،در $\mathbf{R}$ محدب است.
\item\textbf{لگاریتم:}   $\log x$ در$\mathbf{R}_{++}$ مقعر است.
\item\textbf{آنتروپی منفی:}  $x\log x$ (یا در $\mathbf{R}_{++}$ یا در $\mathbf{R}_+$ به عنوان $0$ تعریف می‌شود برای $x=0$) محدب است.
\end{itemize}


تحدب یا تقعر این نمونه‌ها با اثبات نابرابری اولیه (3.1) یا با بررسی مشتق دوم،غیر‌منفی یا غیر‌مثبت است را می‌تواند نشان دهد . مثلا، با $f(x)=x\log x$ داریم 

\[
f'(x)=\log x+1,\qquad f''(x)=1/x,
\]

به‌طوری‌که $f''(x)>0$ برای $x>0$. این نشان می‌دهد که تابع آنتروپی منفی (اکیدا) محدب است. حالا چند نمونه جالب از توابع را در $\mathbf{R}^n$ می‌دهیم.

\begin{itemize}
\item\textbf{نرمها :}  هر نرم در $\mathbf{R}^n$ محدب است.
\item\textbf{توابع $\max$ :}  $f(x)=\max\lbrace x_1,\ldots,x_n\rbrace$ در $R^n$ محدب است.
\item\textbf{تابع درجه دوم بر تابع خطی :}  تابع $f(x,y)=x^2/y$، با

\[
\mathbf{dom}\:f=\mathbf{R}\times\mathbf{R}_{++}=\lbrace (x,y)\in\mathbf{R}^2|y>0\rbrace,
\]
محدب است (شکل ۳).
\item\textbf{لگاریتم ـ مجموع ـ تابع نمایی :}  تابع $f(x)=\log(ee^x_1+\cdots+ee^x_n)$ در $\mathbf{R}$ محدب است.
این تابع می‌تواند به‌عنوان یک تقریب مشتق‌پذیر (در واقع، تحلیلی) از تابع $\max$ تفسیر شود، چون

\[
\max\lbrace x_1,\ldots,x_n\rbrace\leq f(x)\leq\max\lbrace x_1\ldots x_n\rbrace+\log n
\]

برای تمام $x$. (زمانیکه تمام اجزای $x$ برابر هستند، نابرابری دوم برقرار است.) شکل 4 ،$f$ را برای $n=2$ نشان می‌دهد.
\item\textbf{میانگین هندسی:} میانگین هندسی  $f(x)=(\prod_{i=1}^n x_i)^{1/n}$ در $\mathbf{dom}\:f=\mathbf{R}_{++}^n$ مقعر است.
شکل۳.۴:گراف $f(x,y)=\log(ee^x+ee^y)$.
\item\textbf{لگاریتم ـ دترمینان :}  تابع $f(\mathbf{x})=\log\: det\:\mathbf{x}$ در $\mathbf{dom}\: f=S_{++}^n$ مقعر است.
تحدب (یا تقعر) این نمونه‌ها می‌تواند به چند روش اثبات شود، مانند اثبات نابرابری به‌طور مستقیم(3.1) ،اثبات این که هسیین نیمه معین مثبت است، یا با محدود کردن این تابع به یک خط دلخواه و اثبات تحدب تابع به‌دست آمده از یک متغیر.

\end{itemize}
\textbf{نرمها.} اگر $f:\mathbf{R}^n\rightarrow\mathbf{R}$ یک نرم باشد، و $0\leq \theta\leq 1$,

\[
f(\theta x+(1-\theta)y)\leq f(\theta x)+f((1-\theta)y)=\theta f(x)+(1-\theta)f(y).
\]
نابرابری به شرح زیر از نابرابری مثلث، و برابری به شرح زیر از یکنواختی یک نرم.


\textbf{تابع حداکثر.} تابع $f(x)=\max_i x_i$ برای $0\leq\theta\leq 1$،
\begin{align*}
f(\theta\:x+(1-\theta)y) & =\underset{i}{\max}(\theta x_i+(1-\theta)y_i)\\
& \leq \theta\:\underset{i}{\max}\:x_i+(1-\theta)\underset{i}{\max}\:y_i\\
&=\theta f(x)+(1-\theta)f(y).
\end{align*}

\textbf{تابع مرتبه دوم بر تابع خطی.} برای نشان دادن اینکه تابع مرتبه دوم بر خطی $f(x,y)=x^2/y$ محدب است، توجه داشته باشید که (برای$y>0$)،


\[
\bigtriangledown^2 f(x,y)=\frac{2}{y^3}\begin{bmatrix}
y^2 & -{xy}\\
-{xy} & x^2\\
\end{bmatrix}
=\frac{2}{y^3}\begin{bmatrix}
y\\
-x\\
\end{bmatrix}
\begin{bmatrix}
y\\
-x\\
\end{bmatrix}
^T
\succeq 0.
\]


\textbf{لگاریتم ـ مجموع ـ نمایی.} هسیین تابع $(\log-\sum-\exp)$ هست;

\[
\bigtriangledown^2 f(x)=\frac{1}{(1^Tz)^2}((1^Tz) diag(z)-zz^T),
\]
که $z=(ee^{x_1},\ldots,ee^{x_n})$. به منظور بررسی $\bigtriangledown^2 f(x)\succeq 0$ باید نشان دهیم که برای تمام $\upsilon$، $\upsilon^T\bigtriangledown^2 f(x)\upsilon\geq 0$ یعنی 

\[
\upsilon^T\bigtriangledown^2 f(x)\upsilon=\frac{1}{(1^Tz)^2}\left(
\left(
\sum_{i=1}^n z_i\\
\right)
\left(
\sum_{i=1}^n\upsilon_i^2 z_i\\
\right)
-\left(
\sum_{i=1}^n\upsilon_i z_i\\
\right)
^2\\
\right)
\geq 0.
\]
اما این اصل از نابرابری کوشی ـ شوارتز$(a^T a)(b^T b)\geq(a^Tb)^2$  برای بردارها با اجزا $a_i=\upsilon_i\sqrt{z_i}$ ، $ b_i=\sqrt{z_i}$ بکار برده شد.


\textbf{میانگین هندسی.} در روشی مشابه می‌توانیم نشان دهیم که میانگین هندسی $f(x)=(\prod_{i=1}^n x_i)^{1/n}$ در $\mathbf{dom}\:f=\mathbf{R}_{++}^n$ مقعر است. هسیین آن $\bigtriangledown^2 f(x)$ داده می‌شود با 

\[
\frac{\partial^2 f(x)}{\partial x_k^2}=-(n-1)\frac{(\prod_{i=1}^n x_i)^{1/n}}{n^2 x_k^2},\qquad\frac{\partial^2 f(x)}{\partial x_k\partial x_l}=\frac{(\prod_{i=1}^n x_i)^{1/n}}{n^2 x_k x_l}\qquad for\quad k\neq l,
\]

و می‌تواند بیان شود به‌عنوان

\[\bigtriangledown^2 f(x)=-\frac{\prod_{i=1}^n x_i^{1/n}}{n^2}(n diag(1/x_1^2,ldots,1/x_n^2)-qq^T)
\]
که $q_i=1/x_i$.باید نشان دهیم که .$\bigtriangledown^2 f(x)\preceq 0$،یعنی،که 

\[
\upsilon^T\bigtriangledown^2 f(x)\upsilon=-\frac{\prod_{i=1}^n x_i^{1/n}}{n^2}\left(
n\sum_{i=1}^n\upsilon_i^2/x_i^2-\left(
\sum_{i=1}^n\upsilon_i/x_i
\right)^2
\right)
\leq 0
\]
برای تمام $\upsilon$ .دوباره این اصل از نابرابری کوشی شوارتز $(a^T a)(b^T b)\geq(a^Tb)^2$ برای بردارهای $a=1$ و $b_i=\upsilon_i/x_i$ به‌کار برده شده.

\textbf{لگاریتم ـ دترمینان.} برای تابع $f(\mathbf{x})=\log\det\mathbf{x}$ ،می‌توانیم تقعر را با درنظر گرفتن یک خط دلخواه اثبات کنیم
،داده شده با $\mathbf{x}=Z+tV$،که $Z,V\in S^n$ . تعریف می‌کنیم $g(t)=f(Z+tV)$،و $g$ را محدود می‌کنیم که فاصله مقادیر $t$ که برای $Z+tV\succ 0$.
بدون از دست دادن کلیت، می‌توانیم فرض کنیم که $t=0$ داخل این فاصله است، یعنی $Z\succ 0$ . داریم


\begin{align*}
g(t) & =\log\;det(Z+tV)\\
& =\log\;det(Z^{1/2}(I+tZ^{-1/2}VZ^{-1/2})Z^{1/2})\\
& =\sum_{i=1}^n\log(1+t\lambda_i)+\log\;det Z\\
\end{align*}

که $\lambda_1,\ldots,\lambda_n$ مقادیر ویژه $Z^{-1/2}VZ^{-1/2}$.بنابراین داریم

\[
g'(t)=\sum_{i=1}^n\frac{\lambda_i}{1+t\lambda_i}\:,\qquad g''(x)=-\sum_{i=1}^n\frac{\lambda_i^2}{(1+t\lambda_i)^2}.
\]

از آنجائیکه $g''(t)\leq 0$،نتیجه می‌گیریم که $f$ مقعر است.

\subsection{زیرمجموعه‌ها}

 مجموعه $\alpha$-زیر‌سطح تابع $f:\mathbf{R}^n\rightarrow\mathbf{R}$ تعریف می‌شود به‌عنوان  
\[
C_\alpha=\lbrace x\in\mathbf{dom} f|f(x)\leq \alpha\rbrace.
\]                               
زیرمجموعه‌های یک تابع محدب، برای هر مقدار از $a$ محدب هستند. این اثبات از تعریف تحدب ضروری است: اگر $x,y\in C_\alpha$،پس $f(x)\leq \alpha$ و $f(y)\leq\alpha$،و بنابراین $f(\theta x+(1-\theta)y)\leq\alpha$ برای$0\leq\theta\leq 1$ ،و از‌این‌رو $\theta x+(1-\theta)y\in C_\alpha$ .
معکوس این قضیه درست نیست: یک تابع می‌تواند همه‌ی زیرمجموعه‌های محدب آن را داشته باشند، اما یک تابع محدب نباشد. مثلا،$f(x)=-ee^x$ در $\mathbf{R}$محدب نیست(درواقع، اکیدا مقعر است) اما تمام زیرمجموعه‌های آن  محدب هستند. اگر $f$ مقعر باشد، پس تمام $\alpha$-فوق‌سطح آن  داده می‌شود با$\lbrace x\in \mathbf{dom} f|f(x)\geq\alpha\rbrace$،یک مجموعه محدب است. این ویژگی زیرمجموعه، با بیان آن به‌عنوان یک زیرمجموعه از تابعی محدب، یا به‌عنوان مجموعه مرجع از تابعی مقعر اغلب روش خوبی برای  تحدب یک مجموعه است.

\begin{example}
میانگین هندسی و ریاضی $x\in\mathbf{R}_+^n$ بترتیب هستند;

\[
G(x)=\left(
\prod_{i=1}^n x_i\\
\right)^{1/n} ,\qquad  A(x)=\frac{1}{n}\sum_{i=1}^n x_i ,
\]

(که $0^{1/n}=0$ را در تعریفمان از $G$ میگیریم.)میانگین ریاضی - هندسی نابرابری بیان می‌کند که $G(x)\leq A(x)$ . فرض کنید $0\leq\alpha\leq 1$ و درنظر بگیرید مجموعه 

\[
\lbrace x\in\mathbf{R}_+^n|G(x)\geq\alpha A(x)\rbrace,
\]

یعنی مجموعه بردارها با میانگین هندسی حداقل به بزرگی عامل $a$ با میانگین ریاضی متقارن است.این مجموعه محدب است، چون( مجموعه فوق سطح $0-$) از تابع $G(x)-\alpha A(x)$ است، که مقعر است. درواقع، این مجموعه به‌طور مثبت همگن است، بنابراین آن مخروط محدب است.
\end{example}

\subsection{بالای نمودار}
نمودار تابع $f:\mathbf{R}^n\rightarrow\mathbf{R}$ تعریف می‌شود به‌عنوان 

\[
\lbrace(x,f(x))|x\in \mathbf{dom}\:f\rbrace,
\]
که زیر‌مجموعه‌ای از $\mathbf{R}^{n+1}$، است. بالای نمودار یک تابع $f:\mathbf{R}^n\rightarrow\mathbf{R}$ تعریف می‌شود به‌عنوان 

\[
\mathbf{epi} f=\lbrace(x,t)|x\in\mathbf{dom} f,\;f(x)\leq t\rbrace,
\]
که زیر‌مجموعه‌ای از $\mathbf{R}^{n+1}$ است.( $epi$ به معنای بالاست پس اپی‌گراف به معنای بالای نمودار است.) این تعریف در شکل 3.5 نشان داده می‌شود. رابطه بین مجموعه‌های محدب و توابع محدب از طریق اپی‌گراف (بالای نمودار) است: $A$یک تابع محدب است اگر‌و‌تنها‌اگر بالای نمودار آن یک مجموعه محدب است. یک تابع مقعر است اگر‌و‌تنها‌اگر هیپوگراف آن تعریف شد به‌عنوان 

\[
\mathbf{hypo}\:f=\lbrace(x,t)|t\leq f(x)\rbrace,
\]
مجموعه‌ای محدب است.

شکل ۳.۵

\begin{example}


 تابع کسری ماتریس.تابع$f:\mathbf{R}^n\times S^n\rightarrow\mathbf{R}$،تعریف می‌شود به‌عنوان

\[
f(x,Y)=x^T Y^{-1}x
\]

در $\mathbf{dom}\:f=\mathbf{R}^n\times S_{++}^n$ محدب است.(این مثال تابع درجه دوم را بر تابع خطی$f(x,y)=x^2/y$، با $\mathbf{dom}\:f=\mathbf{R}\times\mathbf{R}_{++}$ کلیت می‌بخشد.)یک روش آسان برای ایجاد تحدب $f$ از طریق اپی‌گراف آن صورت می‌گیرد:

\begin{align*}
\mathbf{epi}\:f &=\lbrace(x,Y,t)|Y\succ 0,\;x^TY^{-1}x\leq t\rbrace\\
& =\begin{Bmatrix}
(x,Y,t)\vert \begin{bmatrix}
Y & x\\
x^T & t\\
\end{bmatrix}
\succeq 0,\:Y\succ 0,
\end{Bmatrix}
\end{align*}


                           با استفاده از حالت مکمل اسچور برای نیمه معین مثبت ماتریس بلوکی (5 .5.A §را ببینید).آخرین حالت نابرابری ماتریس خطی در $(x,Y,t)$ است، و بنابراین $\mathbf{epi} f$ محدب است.برای این حالت خاص$n=1$ ،تابع کسری ماتریس به تابع درجه دوم بر تابع خطی $x^2/y$ ساده می‌شود، و ارائه $LMI$ وابسته است

\[
\begin{bmatrix}
y & x\\
x & t\\
\end{bmatrix}
\succeq 0 ,\quad y>0
\]
 (نمودار آن در شکل 3.3 نشان داده می‌شود.)
 \end{example}
 نتایج بسیاری برای توابع محدب می‌تواند به‌طور هندسی با استفاده از اپی‌گراف‌‌ها، و با به‌کار بردن نتایج برای مجموعه‌های محدب  ثابت شود(یا تفسیر شود). به عنوان یک مثال، حالت مرتبه اول برای تحدب  را در نظر بگیرید:
 
\[
f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x),
\]
که $f$ محدب است و $x,y\in\mathbf{dom}\:f$ . می‌توانیم این نابرابری اساسی را به طور هندسی در عبارت $\mathbf{epi}\:f $ تفسیر کنیم.اگر $(y,t)\in\mathbf{epi}\:f$،پس

\[
t\geq f(y)\geq f(x)+\bigtriangledown f(x)^T(y-x).
\]                               
 
شکل ۳.۶
می‌توانیم این‌ را بیان کنیم مانند:
\[
 (y,t)\in\mathbf{epi}\:f\Longrightarrow \Longrightarrow\begin{bmatrix}
 \bigtriangledown f(x)\\
 -1\\
 \end{bmatrix}
 ^T\left(
 \begin{bmatrix}
 y\\
 t\\
 \end{bmatrix}
 -\begin{bmatrix}
 x\\
 f(x)\\
 \end{bmatrix}
 \right)
 \leq 0.
 \]
این به این معناست که هیپوگراف تعریف شده با $(\bigtriangledown f(x),-1)$ پشتیبانی می‌کند$mathbf{epi}\:f$ را در نقطه مرزی$(x,f(x))$ ;شکل 3.6 را ببینید.
\subsection{نابرابری و پسوندهای جنسن}
نابرابری اساسی(3.1) ،یعنی
\[
f(\theta x+(1-\theta)y)\leq\theta f(x)+(1-\theta)f(y),
\]
                    
گاهی نابرابری جنسن نامیده می‌شود. آن به آسانی به ترکیبات محدب بیشتر از دو نقطه گسترش داده می‌شود: اگر $f$ محدب باشد،$x_1,\ldots,x_k\in\mathbf{dom}\:f$ ،و $\theta_1,\ldots,\theta_k\geq 0$ با $\theta_1+\cdots+\theta_k=1$،پس 
\[
f(\theta_1 x_1+\cdots+\theta_k x_k)\leq \theta_1 f(x_1)+\cdots+\theta_k f(x_k).
\]

در نتیجه، در مورد مجموعه‌های محدب، این نابرابری به حاصل جمع نامتناهی، انتگرال، و مقادیر مورد انتظار گسترش داده می‌شود. مثلا، اگر $p(x)\geq 0$ در $S\subseteq\mathbf{dom}\:f$،$\int_S p(x)\dd x$ پس

\[
f\left(\int_S p(x)x\dd x\right)\leq\int_S f(x)p(x)\dd x,
\]
مشروط به انتگرالهایی که وجود دارد. در حالت کلی می‌توانیم هر احتمال اندازه‌گیری را با حمایت در $\mathbf{dom}$   در نظر 
 بگیریم. اگر $x$ متغیری تصادفی باشد به‌طوری‌که $x\in  \mathbf{dom}\:f$با احتمال یک، و $f$ محدب است، پس داریم 

\begin{equation}
f(Ex)\leq E f(x),
\end{equation}

مشروط به انتظاراتی که وجود دارد. می‌توانیم نابرابری اساسی (3.1) را ازاین شکل کلی، با در نظر گرفتن متغیر تصادفی $x$ که از $\lbrace x_1,x_2\rbrace$ حمایت می‌کند،با$\mathbf{prob}(x=x_1)=\theta$،$\mathbf{prob}(x=x_2)=1-\theta$ بازیابی کنیم. بنابراین نابرابری (3.5) تحدب را مشخص می‌کند: اگر $f$ محدب نباشد,متغیر تصادفی $x$،با $x\in\textbf{dom} f$ با احتمال یک،به‌طوری‌که $f(Ex)=Ef(x)$ وجود دارد. حالا تمام این نابرابریها، نابرابری جنسن نامیده می‌شود، حتی اگر نابرابری مورد مطالعه توسط جنسن یک  
\[
f\left(\frac{x+y}{2}\right)\leq\frac{f(x)+f(y)}{2}
\]
بسیار ساده بود.

\begin{remark}

می‌توانیم (3.5) را به شرح زیر تفسیر کنیم. فرض کنید $x\in\mathbf{dom}\:f\subseteq R^n$ و $z$ هرمقدار بردار تصادفی صفر در $\mathbf{R}^n$ است. پس داریم 
\[
Ef(x+z)\geq f(x).
\]
بنابراین، تصادفی یا لرزشی (یعنی با اضافه کردن مقدار بردار تصادفی صفر برای استدلال )نمی‌تواند مقدار تابع محدب را به‌طور متوسط کاهش دهد. 
\end{remark}

\subsection{نابرابری}

بسیاری از نابرابری‌های معروف می‌تواند با استفاده از نابرابری جنسین به تعدادی تابع محدب مناسب مشتق شود.(درواقع، تحدب و نابرابری جنسین می‌تواند پایه و اساس یک نظریه نابرابری را بسازد.)به‌عنوان یک مثال ساده، میانگین نابرابری ریاضی-هندسی را در نظر بگیرید:

\begin{equation}
\sqrt{ab}\leq(a+b)/2
\end{equation}

 برای $a,b\geq 0$. تابع $-\log \;x$ محدب است. نابرابری جنسن با .$\theta=1/2$ حاصل 
 
\[
-\log\left(\frac{a+b}{2}\right)\leq\frac{-\log\;a-\log\;b}{2}
\]

با در نظر گرفتن نمایی از دو سمت (3.6) حاصل می‌شود. به‌عنوان یک مثال کم اهمیت‌تر نامساوی هولدر را ثابت می‌کنیم: برای $p> 1$،$1/p+1/q=1$ و $x,y\in\mathbf{R}^n$،

\[
\sum_{i=1}^n x_i y_i\leq\left(\sum_{i=1}^n |x_i|^p\right)^{1/p}\left(\sum_{i=1}^n |y_i|^q\right)^{1/q}.
\]

با تحدب$-\log\;x$، و نابرابری جنسن به‌طور کلی$\theta$ ،میانگین نابرابری ریاضی هندسی کلی‌تری را به‌دست می‌آوریم.

\[
a^\theta b^{1-\theta}\leq \theta a+(1-\theta)b,
\]

برای $a,b\geq 0$ و $0\leq\theta\leq 1$ معتبر است.به‌کار بردن این را با 

\[
a=\frac{|x_i|^p}{\sum_{j=1}^n |x_j|^p},\qquad b=\frac{|y_i|^q}{\sum_{j=1}^n |y_j|^q},\qquad \theta=1/p,
\]
حاصل می‌شود
\[
\left(\frac{|x_i|^p}{\sum_{j=1}^n |x_j|^p}\right)^{1/p}\left(\frac{|y_i|^q}{\sum_{j=1}^n |y_j|^q}\right)^{1/q}\leq\frac{|x_i|^p}{p\sum{j=1}^n |x_j|^p}+\frac{|y_i|^q}{q\sum_{j=1}^n |y_j|^q}.
\]
  
با جمع کردن $i$ پس نابرابری هولدر حاصل می‌شود.

\section{عملکردهایی که تحدب را حفظ می‌کند}

در این بخش برخی عملکردهایی را که تحدب و تقعر توابع را حفظ می‌کند، یا به ما اجازه می‌دهد که توابع محدب و مقعر جدید بسازیم را شرح می‌دهیم. با برخی عملکردهای ساده مثل افزایش، مقیاس‌گذاری، و سوپریمم نقطه نقطه شروع می‌کنیم و سپس برخی عملکردهای پیچیده‌تر مثل (برخی از آنها عبارتند از عملکردهای ساده مانند موارد خاص) را شرح می‌دهیم.

\subsection{مقادیر وزن‌دار غیرمنفی}

بدیهی ست اگر $f$ تابعی محدب و$\alpha\geq 0$،است، پس تابع $\alpha f$ محدب است. اگر $f_1$ و $f_2$ هر دو توابع محدب هستند، پس مجموع آنها $f_1+f_2$ است. با ترکیب مقیاس‌گذاری و افزایش غیرمنفی، می‌بینیم که مجموعه‌ای از توابع محدب خودش مخروطی محدب است: مقادیر وزن‌دار غیر منفی توابع محدب،
\[
f=\omega_1 f_1+\cdots+\omega_m f_m,
\]

محدب است. به همین شکل، مقادیر وزن‌دار غیر‌منفی توابع مقعر، مقعر است. مقادیر وزن‌دار غیر‌منفی، غیر‌صفر توابع اکیدا محدب (مقعر) اکیدا محدب (مقعر ) است. این ویژگی‌ها به مقادیر نامتناهی و انتگرال‌ها گسترش می‌یابد. مثلا، اگر $f(x,y)$در $x$ برای هر $y\in\mathcal{A}$،و $\omega(y)\geq 0$ برای هر $y\in\mathcal{A}$ محدب است،پس تابع $g$ تعریف می‌شود به عنوان

\[
g(x)=\int_\mathcal{A}\omega(y) f(x,y)\dd y
\]

 در $x$ محدب است(مشروط به اینکه انتگرال وجود دارد.) واقعیت این است که تحدب تحت مقیاس‌گذاری و افزایش غیر‌منفی به آسانی مستقیما بازبینی می‌شود،یا می‌تواند درشرایط اپی‌گراف‌های وابسته دیده شود.مثلا،اگر $\omega\geq 0$ و$f$ محدب باشد،داریم 
 
 \[
 \mathbf{epi}(\omega f)=\begin{bmatrix}
 I & 0\\
 0 & \omega\\
 \end{bmatrix}
 \mathbf{epi}\:f,
 \]

که محدب است چون تصویر مجموعه‌ای محدب تحت نگاشتی خطی محدب است.
\subsection{ترکیب با نگاشتی معین}

فرض کنید $f:\mathbf{R}^n\rightarrow\mathbf{R}$،$A\in\mathbf{R}^{n\times m}$،و $b\in\mathbf{R}^n$ . تعریف کنید $g:\mathbf{R}^m\rightarrow\mathbf{R}$ را با 
\[
g(x)=f(Ax+b),
\]
با$g=\lbrace x\;|\: Ax+b\in \mathbf{dom}\:f\rbrace$  .پس اگر $f$ محدب باشد پس $g$ است،اگر $f$ مقعر باشد،پس $g$ است.
\subsection{ماکزیمم و سوپریمم نقطه به نقطه}

اگر $f_1$  و$f_2$ توابع محدب هستند پس ماکزیمم نقطه به نقطه $f$ تعریف می‌شود با 

\[
f(x)=\max\lbrace f_1(x),f_2(x)\rbrace ,
\]

با$\mathbf{dom}\:f=\mathbf{dom}\:f_1\cap\mathbf{dom}\:f_2$،نیز محدب است.این ویژگی به آسانی بازبینی می‌شود: اگر $0\leq\theta\leq 1$ و$x,y\in\mathbf{dom}\:f$،پس

\begin{align*}
f(\theta x+(1-\theta)y) & =\max\lbrace f_1(\theta x+(1-\theta)y),f_2(\theta x+(1-\theta)y\rbrace\\
& \leq\max\lbrace\theta f_1(x)+(1-\theta)f_1(y),\theta f_2(x)+(1-\theta)f_2(y)\rbrace\\
& \leq\theta\max\lbrace f_1(x),f_2(x)\rbrace +(1-\theta)max\lbrace f_1(y),f_2(y)\rbrace\\
& =\theta f(x)+(1-\theta)f(y),
\end{align*}

که تحدب $f$ را ایجاد می‌کند. به آسانی نشان داده می‌شود که اگر $f_1,\ldots,f_m$ محدب هستند. پس ماکزیمم نقطه به نقطه 

\[
f(x)=\max\lbrace f_1(x),\ldots,f_m(x)\rbrace
\]
نیز محدب است.

\begin{example}
توابع تکه‌ای-خطی.تابع 

\[
f(x)=\max\lbrace a_1^T x+b_1,\ldots,a_l^T x+b_l\rbrace
\]
                             
تابع تکه‌ای-خطی (یا واقعا،معین)(با $L$ یا ناحیه کمتر)را تعریف می‌کند. آن محدب است چون ماکزیمم نقطه به نقطه توابع معین است. معکوس این قضیه نیز می‌تواند نشان داده شود: هر تابع محدب تکه ای-خطی با $L$ یا ناحیه کمتر می‌تواند در این شکل بیان شود.

\end{example}

\begin{example}
مجموع بزرگترین قطعات $r$ .برای $x\in\mathbf{R}^n$  با $x_{[i]}$  بزرگترین جزئ $i$ام    $x$مشخص می‌کنیم، یعنی
\[
x_{[1]}\geq x_{[2]}\geq\cdots\geq x_{[n]}
\]

اجزای $x$ در ترتیب غیر‌افزایشی طبقه‌بندی می‌شوند.پس تابع
\[
f(x)=\sum_{i=1}^r x_{[i]},
\]
مجموع بزرگترین اجزای $r$ از $x$ تابعی محدب است.این می‌تواند با نوشتن آن به عنوان 
\[
f(x)=\sum_{i=1}^r x_{[i]}=\max\lbrace x_{i_1}+\cdots+x_{i_r}\:|\: 1\leq i_1< i_2<\cdots<i_r\leq n\rbrace,
\]
دیده شود. یعنی، ماکزیمم تمام مقادیر ممکن اجزای متفاوت $r$ از $x$.از آنجائی‌که ماکزیمم نقطه به نقطه توابع خطی $n!/(r!(n-r)!)$  است، آن محدب است. به‌عنوان یک پسوند آن می‌تواند نشان داده شود که تابع $\sum_{i=1}^r w_i x_{[i]}$ محدب است، مشروط بر اینکه $w_1\geq w_2\geq\cdots\geq w_r\geq 0$. 
ویژگی ماکزیمم نقطه به نقطه به سوپریمم نقطه به نقطه بیش از مجموعه نامتناهی توابع محدب گسترش می‌یابد. اگر برای هر $y\in\mathcal{A}$ ،$f(x,y)$ در $x$ محدب است،پس تابع $g$ تعریف شده به طوریکه

\begin{equation}
g(x)=\underset{y\in\mathcal{A}}{\sup} f(x,y)
\end{equation}

در $x$ محدب است.در اینجا دامنه $g$ است
\[
\mathbf{dom}\:g=\lbrace x|(x,y)\in\mathbf{dom}برای هر y\in\mathcal{A},\:\underset{y\in\mathcal{A}}{\sup} f(x,y)<\infty\rbrace.
\]

به همین ترتیب، اینفیمم نقطه به نقطه  مجموعه‌ای از توابع مقعر تابعی مقعر است.به لحاظ اپی‌گرافها، سوپریمم نقطه به نقطه توابع مربوط به تلاقی اپی‌گرافها است:با $f$،$g$ و $\mathcal{A}$ همان‌طور که در (3.7) تعریف شد،داریم

\[
\mathbf{epi}\:g=\underset{y\in\mathcal{A}}{\bigcap}\mathbf{epi}\:f(\cdot,y).
\]

بنابراین، نتیجه زیر از این حقیقت این است که تلاقی خانواده‌ای از مجموعه‌های محدب، محدب است.

\end{example}
\begin{example}
تابع تائید از یک مجموعه. فرض کنید $C\subseteq\mathbf{R}^n$ ،با $C\neq\emptyset$. تابع تائید $S_C$    مرتبط با مجموعه $C$ تعریف می‌شود به‌طوری‌که
\[
S_C(x)=\sup\lbrace x^T y|y\in C\rbrace
\] 

(و، طبیعتا $\mathbf{dom}\:S_C=\lbrace x|\sup_{y\in C} x^T y<\infty\rbrace$).
برای هر $y\in C$ ،$x^T y$  تابعی خطی از $x$ است، پس $S_C$ سوپریمم  نقطه به نقطه‌ی خانواده‌ای از توابع خطی است، بنابراین، محدب است.
\end{example}

\begin{example}
فاصله دورترین نقطه از یک مجموعه. فرض کنید$C\subseteq\mathbf{R}^n$. این فاصله(در هر قاعده) برای دورترین نقطه‌ی $C$،
\[
f(x)=\underset{y\in C}{\sup}\Vert x-y\Vert،
\]
محدب است. برای دیدن این، توجه کنید که برای هر $y$، تابع$\Vert x-y\Vert$ در $x$ محدب است. از آنجائی‌که $f$ سوپریمم نقطه به نقطه خانواده‌ای از توابع محدب است (نشان داده می‌شود با$y\in C$)، آن تابعی محدب از $x$ است.
\end{example}

\begin{example}
ارزش حداقل-مجذورها به‌عنوان تابعی از وزنها. فرض کنید$a_1,\ldots,a_n\in\mathbf{R}^m$. در مسئله حداقل-مجذورهای وزن‌دار تابع هدف$\sum_{i=1}^n w_i(a_i^T x-b_i)^2$  را بیشتر از $x\in\mathbf{R}^m$  به حداقل می‌رسانیم. به $w_i$ به عنوان وزن‌دار اشاره می‌کنیم، و $w_i$ منفی را می‌پذیریم(که این احتمال را که تابع هدف زیر بیکران است را باز می‌کند). ارزش حداقل-مجذورات وزن‌دار (بهینه) را تعریف کردیم به‌طوری‌که 


\[
g(w)=\underset{x}{\inf}\sum_{i=1}^n w_i(a_i^T x-b_i)^2,
\]
با دامنه

\[
\mathbf{dom}\:g=\begin{Bmatrix}
w\arrowvert\underset{x}{\inf}\sum_{i=1}^n w_i(a_i^T x-b_i)^2>-\infty
\end{Bmatrix}
\]

ازآنجائی‌که $g$ خانواده‌ای از توابع خطی $w$ (نشان داده می‌شود با $x\in\mathbf{R}^n$)، آن تابع مقعر $w$ است. می‌توانیم بیانی صریح و روشن برای $g$ استنتاج کنیم، تقریبا بر روی بخشی از دامنه آن. فرض کنید، ماتریس مورب با عناصر$w_1,\ldots,w_n$ ، و فرض کنید $A\in\mathbf{R}^{n\times m}$  ردیف‌های ${a_i}^T$ را دارد، بنابراین داریم 

\[
g(w)=\underset{x}{inf}(Ax-b)^T W(Ax-b)=\underset{x}{inf}(x^T A^T WAx-2b^T WAx+b^T Wb).
\]
از این توضیحات دیدیم که اگر $A^T WA\nsucceq 0$، تابع درجه دوم زیر در $x$ بیکران است، پس $g(w)=-\infty$،  یعنی $w\notin\mathbf{dom}\:g$ .می‌توانیم بیان ساده‌ای برای $g$ بدهیم زمانی‌که $A^T WA\succ 0$ (که نابرابری ماتریس خطی شدیدی را تعریف می‌کند)، با به حداقل رساندن تابع درجه دوم  به‌طور تحلیلی:

\begin{align*}
g(w) & =b^T Wb-b^T WA(A^T WA)^{-1} A^T Wb\\
& =\sum_{i=1}^n w_i b_i^2-\sum_{i=1}^n w_i^2 b_i^2 a_i^T\left(\sum_{j=1}^n w_j a_j a_j^T\right)^{-1}a_i.
\end{align*}
از این بیان تقعر $g$  فورا آشکار نمی‌شود(اما آن را دنبال می‌کند، مثلا، از تحدب تابع کسری ماتریس; مثال 3.4 را ببینید).
 
\end{example}

\begin{example}
حداکثر مقادیر ویژه ماتریس متقارن.تابع $f(\mathbf{X})=\lambda_max(\mathbf{X})$، با $\mathbf{dom}\:f=\mathbf{S}^{rn}$، محدب است. برای دیدن این توضیح، $f$ را بیان می‌کنیم به‌طوری‌که 

\[
f(\mathbf{X})=\sup\lbrace y^T\mathbf{X} y|\:\Vert y\Vert_2=1\rbrace,
\]
یعنی بعنوان سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع خطی $\mathbf{X}$ (یعنی $y^T\mathbf{X}y$)نشان داده می‌شود با $y\in\mathbf{R}^m$.

\end{example}

\begin{example}

قاعده یک ماتریس. $f(\mathbf{ٓٓX})=\Vert\mathbf{X}\Vert_2$ را با $\mathbf{dom}\: f=\mathbf{R}^{p\times q}$، درنظر بگیرید، که $\Vert\cdot\Vert_2$ قاعده طیفی یا مقدار منحصر بفرد ماکسیمم را نشان می‌دهد. تحدب $f$ استنباط می‌شود از 
\[
f(\mathbf{X})=\sup\lbrace u^T\mathbf{X}\upsilon|\:\Vert u\Vert_2=1,\:\Vert\upsilon\Vert_2=1\rbrace,
\]
که نشان می‌دهد که آن سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع خطی $X$ است.به عنوان یک کلیت فرض کنید $\Vert\cdot\Vert_a$ و $\Vert\cdot\Vert_b$ به ترتیب قاعده‌هایی در $\mathbf{R}^p$ و $\mathbf{R}^q$ است. قاعده ناشی از ماتریس $\mathbf{X}\in\mathbf{R}^{p\times q}$ تعریف می‌شود به عنوان 

\[
\Vert\mathbf{X}\Vert_{a,b}=\underset{\upsilon\neq 0}{\sup}\frac{\Vert\mathbf{X}_\upsilon\Vert_a}{\Vert\upsilon\Vert_b}.
\]
(این زمانی‌که هر دو قاعده اقلیدسی هستند به قاعده طیفی ساده می‌شود.)قاعده استنتاج شده می‌تواند بیان شود به عنوان 

\begin{align*}
\Vert\mathbf{X}\Vert_{a,b} &=\sup\lbrace\Vert\mathbf{X}_\upsilon\Vert_a\:|\:\Vert\upsilon\Vert_b=1\rbrace\\
&=\sup\lbrace u^T\mathbf{X}\upsilon\:|\:\Vert u\Vert_{a^*}=1,\:\Vert\upsilon\Vert_b=1\rbrace,
\end{align*}

که $\Vert\cdot\Vert_{a^*}$ قاعده $\Vert\cdot\Vert_a$، دوگانه  است و این حقیقت را به‌کار می‌بریم که 

\[
\Vert z\Vert_a=\sup\lbrace u^T z\:|\:\Vert u\Vert_{a^*}=1\rbrace.
\]
ازانجائی‌که $\Vert\mathbf{X}\Vert_{a,b}$ را به‌‌عنوان سوپریمم توابع خطی $\mathbf{X}$ بیان کردیم، تابعی محدب است.
 
\end{example}

\section*{ارائه به‌عنوان سوپریمم نقطه به نقطه توابع معین}
مثال‌های بالا روش خوبی برای گسترش تحدب یک تابع را نشان می‌دهند: با بیان آن به‌عنوان سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع معین. جز برای شرایط فنی، معکوس را حفظ می‌کند: تقریبا هر تابع محدبی می‌تواند به عنوان سوپریمم نقطه به نقطه‌ی خانواده‌ای از توابع معین بیان شود. مثلا، اگر $f:\mathbf{R}^n\rightarrow\mathbf{R}$ محدب باشد، با $\mathbf{dom}\: f=\mathbf{R}^n$، پس داریم 

\[
f(x)=\sup\lbrace g(x)\:|\:g\:\text{معین},\:g(z)\leq f(z)\:\text{برای هر}\: z\rbrace.
\]
به عبارت دیگر$f$، سوپریمم نقطه به نقطه‌ی مجموعه‌ای از تمام برآوردگرهای معین معروف تحت آن است. اثبات این نتیجه را در زیر می‌دهیم، و این مورد را که $\mathbf{dom}\: f=\mathbf{R}^n$ به‌عنوان یک تمرین است را رها می‌کنیم(تمرین 3.28).فرض کنید $f$ با $\mathbf{dom}\: f=\mathbf{R}^n$ محدب است. نابرابری 

\[
f(x)\geq\sup\lbrace g(x)\:|\:g\:\text{معین},\:g(z)\leq f(z)\:\text{برای هر}\:z\rbrace
\] 

واضح است، چون اگر $g$، تحت هر برآوردگر معین $f$ باشد، داریم $g(x)\leq f(x)$. برای ایجاد برابری، نشان می‌دهیم که برای هر $x\in\mathbf{R}^n$ یک تابع معین $g$ وجود دارد، که تحت برآوردگر معروف $f$ است و $g(x)=f(x)$ را اثبات می‌کند. البته اپی‌گراف بالای نمودار $f$ مجموعه‌ای محدب است. بنابراین، می‌توانیم بیابیم یک ابرصفحه را برای آن در $(x,f(x))$ یعنی $a\in\mathbf{R}^n$ و $b\in\mathbf{R}$ با $(a,b)\neq 0$ و 

\[
\begin{bmatrix}
a\\
b\\
\end{bmatrix}^T
\begin{bmatrix}
x-z\\
f(x)-t\\
\end{bmatrix}\leq 0
\]

برای هر$(z,t)\in\mathbf{epi} f$.این به این معنی است که

\begin{equation}
a^T(x-z)+b(f(x)-f(z)-s)\leq 0
\end{equation}

برای تمام $z\in\mathbf{dom}\: f=\mathbf{R}^n$ و تمام $s\geq 0$ (چون $(z,t)\in\mathbf{epi} f$ یعنی $t=f(z)+s$ برای برخی از $s\geq 0$). برای نابرابری (3.8) که برای همه $s\geq 0$ حفظ می‌کند، باید داشته باشیم $b\geq 0$.اگر $b=0$، پس نابرابری (3.8) به $a^T(x-z)\leq 0$ برای تمام $z\in\mathbf{R}^n$ ساده می‌شود که $a=0$ و تضادهای $(a,b)\neq 0$ را دلالت می‌کند. نتیجه می‌گیریم که $b>0$ یعنی، اینکه ابرصفحه عمودی نیست.

با استفاده از این حقیقت که $b>0$ برای $s=0$ بازنویسی می‌کنیم به عنوان

\[
g(z)=f(x)+(a/b)^T(x-z)\leq f(z)
\]

برای هر $z$.تابع  $g$ تحت برآوردگر معین $f$ است و $g(x)=f(x)$ را اثبات می‌کند. 

\subsection{ترکیب}

در این بخش شرایط را در $h:\mathbf{R}^k\rightarrow\mathbf{R}$ و $g:\mathbf{R}^n\rightarrow\mathbf{R}^k$ بررسی می‌کنیم که تحدب یا تقعرترکیب آنها را در $f=hog:\mathbf{R}^n\rightarrow\mathbf{R}$ تضمین می‌کند، تعریف می‌شود با
 
\[
f(x)=h(g(x)),\qquad\mathbf{dom}\: f=\lbrace x\in\mathbf{dom}\: g\:|\:g(x)\in\mathbf{dom}\; h\rbrace.
\]
\section*{ترکیب عددی}

ابتدا نمونه $k=1$ را در نظر می‌گیریم، پس $h:\mathbf{R}\rightarrow\mathbf{R}$ و$g:\mathbf{R}^n\rightarrow\mathbf{R}$ .می‌توانیم خودمان را به مورد $n=1$ محدود کنیم (چون تحدب با رفتار یک تابع درخطوط دلخواه که دامنه خود را از وسط قطع می‌کند، مشخص می‌شود. برای یافتن قواعد ترکیب، با این فرض که $h$ و $g$ دوبار مشتق‌پذیرند، با $\mathbf{dom}\:g=\mathbf{dom}\:h=\mathbf{R}$ شروع می‌کنیم. در این مورد، تحدب $f$ به $f''\geq 0$ کاسته می‌شود.( به این معنی که $f''(x)\geq 0$ برای تمام $x\in\mathbf{R}$). مشتق دوم تابع ترکیب $f=hog$ داده می‌شود با 

\begin{equation}
f''(x)=h''(g(x))g'(x)^2+h'(g(x))g''(x).
\end{equation}

حالا فرض کنید که، مثلا، $g$ محدب باشد (پس $g''\geq 0$) و $h$ محدب و غیر‌کاهشی است (پس $h''\geq 0$ و $h'\geq 0$). آن از (3.9) پیروی می‌کند که $f''\geq 0$. یعنی،$f$ محدب است. در روشی مشابه، عبارت (3.9) این نتایج را می‌دهد: 

\begin{equation}
\begin{align*}
 
$f$ محدب است اگر $h$ محدب و غیر‌کاهشی است، و $g$ محدب است. 
$f$ محدب است اگر $h$  محدب و غیر‌افزایشی باشد، و $g$ مقعر است.                                                                                                                                                                                                  
$f$ مقعر است اگر $h$ مقعر و غیر‌کاهشی باشد، و $g$ مقعر است. 
$f$ مقعر است اگر $h$ مقعر و غیر‌افزایشی باشد، و $g$ محدب است. 
\end{align*}
\end{equation}
زمانیکه توابع $g$ و $h$ دو‌بار مشتق پذیر هستند و دامنه‌هایی دارند که همه از $\mathbf{R}$ هستند این توضیحات معتبرند. به نظر می‌رسد که قواعد ترکیب بسیار مشابه در حالت کلی $n>1$، بدون درنظرگرفتن قابلیت مشتق‌پذیری $h$ و $g$ یا اینکه $\mathbf{dom}\:g=\mathbf{R}^n$ و $\mathbf{dom}\:h=\mathbf{R}$ را حفظ می‌کند. 
\begin{equation}
 
$f$ محدب است اگر $h$ محدب باشد،$\tilde{h}$ غیر‌کاهشی است، و $g$ محدب است. 
$f$ محدب است اگر $h$ محدب باشد، $\tilde{h}$ غیر‌افزایشی است، و $g$ مقعر است. 
$f$ مقعر است اگر $h$ مقعر باشد، $\tilde{h}$ غیر‌کاهشی است، و $g$ مقعر است.    
$f$  مقعر است اگر $h$ مقعر باشد، $\tilde{h}$غیر‌افزایشی است، و $g$ محدب است. 
\end{equation}

در اینجا $\tilde{h}$ پسوند مقدار افزایش یافته تابع $h$ را نشان می‌دهد، که مقدار$\infty$($-\infty$) را برای نقاط تعیین می‌کند نه در $\mathbf{dom}\:h$ برای $h$ محدب (مقعر). تنها تفاوت بین این نتایج و نتایج موجود در (3.10)، این است که ما به تابع گسترش مقدار توسعه یافته $\tilde{h}$ نیاز داریم تا غیر‌افزایشی یا غیر‌کاهشی در همه $\mathbf{R}$ باشد. برای اینکه بفهمیم این مطلب به چه معناست، فرض کنید $h$ محدب است، بنابراین $\tilde{h}$ مقدار $\infty$ خارج از $\mathbf{dom}\:h$ می‌گیرد.می‌گویند $\tilde{h}$غیر‌کاهشی است به این معنی که برای هر $x,y\in\mathbf{R}$ با $x<y$ داریم $\tilde{h}(x)\leq\tilde{h}(y)$. به‌طور خاص، این به این معناست که اگر $y\in\mathbf{dom}\:h$ پس $x\in\mathbf{dom}\:h$. به‌عبارت دیگر، دامنه $h$  به‌طور بی‌نهایت در جهت منفی گسترش می‌یابد؛ آن هر یک از $\mathbf{R}$ یا فاصله‌ای از شکل$(-\infty,a)$ یا $(-\infty,a]$ است. در روشی مشابه، می‌گویند که $h$ محدب است و $\tilde{h}$ غیر‌افزایشی است به این معنی که $h$ غیر‌افزایشی و $\mathbf{dom}\:h$ به‌طور بی‌نهایت در جهت مثبت گسترش می‌یابد.این در شکل 3.7 نشان داده می‌شود. 
 
 \begin{example}
برخی از نمونه‌های ساده این شرایط در $h$ نشان داده می‌شود که در قضیه‌های ترکیب ظاهر می‌شود.
\begin{itemize}
\item تابع $h(x)=\log x$، با $\mathbf{dom}\:h=\mathbf{R}_{++}$،مقعر است و $\tilde{h}$ غیر‌کاهشی را ثابت می‌کند.
\item          تابع $h(x)=x^{1/2}$، با $\mathbf{dom}\:h=\mathbf{R}_+$ ،مقعر است و شرط $\tilde{h}$ غیر‌کاهشی را اثبات می‌کند. 
 \item          تابع$h(x)=x^{3/2}$ ، با $\mathbf{dom}\:h=\mathbf{R}_+$، محدب است اما شرط $\tilde{h}$غیر‌کاهشی را اثبات می‌کند. مثلا، داریم $\tilde{h}(-1)=\infty$ ،اما $\tilde{h}(1)=1$.
\item تابع $h(x)=x^{3/2}$ برای $x\geq 0$، و $h(x)=0$ برای $x<0$، با $\mathbf{dom}\:h=\mathbf{R}$، محدب است و شرط $\tilde{h}$ غیر‌کاهشی را بازی می‌کند.
\end{itemize}
\end{example}
نتایج ترکیب (3.11)، بدون فرض قابلیت مشتق‌پذیری یا با استفاده از فرمول (3.9) مستقیما می‌تواند ثابت شود. به عنوان یک مثال، قضیه ترکیب زیر را ثابت می‌کنیم: اگر $g$ محدب باشد، $h$ محدب است و $\tilde{h}$ غیر‌کاهشی است پس $f=hog$ محدب است. فرض کنید که $x,y\in\mathbf{dom}\:f$، و $0\leq\theta\leq 1$. از انجائی‌که $x,y\in\mathbf{dom}\:f$ داریم که $x,y\in\mathbf{dom}\:g$ و $g(x),g(y)\in\mathbf{dom}\:h$. چون $\mathbf{dom}\:g$ محدب است، نتیجه می‌گیریم که $\theta x+(1-\theta)y\in\mathbf{dom}\:g$، و از تحدب $g$، داریم 
\begin{equation}
g(\theta x+(1-\theta)y)\leq\theta g(x)+(1-\theta)g(y).
\end{equation}

ازآنجائی‌که $g(x),g(y)\in\mathbf{dom}\:h$، نتیجه می‌گیریم که $\theta g(x)+(1-\theta)g(y)\in\mathbf{dom}\:h$ یعنی سمت راست(3.12) در $\mathbf{dom}\:h$  است.حالا  این فرض که $\tilde{h}$غیر‌کاهشی است را به‌کار می‌بریم که به این معنی است که دامنه آن به‌طور بی‌نهایت در جهت منفی گسترش می‌یابد. چون سمت راست (3.12) در $\mathbf{dom}\:h$ است، نتیجه می‌گیریم که سمت چپ، یعنی $g(\theta x+(1-\theta)y)\in\mathbf{dom}\:h$. این به این معناست که $\theta x+(1-\theta)y)\in\mathbf{dom}\:f$.در نتیجه، نشان داده‌ایم که $\mathbf{dom}\:f$ محدب است.

حالا با استفاده از این حقیقت که $\tilde{h}$ غیر‌کاهشی است و نابرابری (3.12) به‌دست می‌آوریم 

\begin{equation}
h(g(\theta x+(1-\theta)y))\leq h(\theta g(x)+(1-\theta)g(y).
\end{equation}

از تحدب $h$، داریم 

\begin{equation}
h(\theta g(x)+(1-\theta)g(y))\leq\theta h(g(x))+(1-\theta)h(g(y)).
\end{equation}

قرار دادن (3.13) و (3.14) باهم، داریم

\[
h(g(\theta x+(1-\theta)y))\leq\theta h(g(x))+(1-\theta)h(g(y)).
\]
که قضیه‌ی ترکیب را ثابت می‌کند. 

\begin{example}
نتایج ترکیب ساده.

\begin{itemize}
\item اگر $g$ محدب باشد پس $\exp\:g(x)$ محدب است.
\item اگر $g$ مقعر و مثبت  باشد، پس $\log g(x)$ مقعر است.
\item          اگر $g$ مقعر و مثبت باشد، پس $1/g(x)$ محدب است.
\item اگر $g$ محدب و غیر‌منفی و $p\geq 1$، است پس $g(x)^p$ محدب است. 
\item اگر $g$ محدب است پس $-\log(-g(x))$  در $\lbrace x\:|\:g(x)<0\rbrace$ محدب است.
\end{itemize}
\end{example}


\end{document}